Cảm ơn bạn đã ghé thăm Nature.com. Phiên bản của trình duyệt bạn đang sử dụng có hỗ trợ CSS giới hạn. Để có kết quả tốt nhất, chúng tôi khuyên bạn nên sử dụng phiên bản mới hơn của trình duyệt của bạn (hoặc tắt chế độ tương thích trong Internet Explorer). Trong thời gian chờ đợi, để đảm bảo hỗ trợ liên tục, chúng tôi sẽ hiển thị trang web mà không có kiểu dáng hoặc javascript.
Răng được coi là chỉ số chính xác nhất về tuổi của cơ thể con người và thường được sử dụng trong đánh giá tuổi pháp y. Chúng tôi nhằm mục đích xác nhận ước tính tuổi nha khoa dựa trên khai thác dữ liệu bằng cách so sánh độ chính xác ước tính và hiệu suất phân loại của ngưỡng 18 năm với các phương pháp truyền thống và ước tính tuổi dựa trên dữ liệu. Tổng cộng có 2657 lần chụp X quang toàn cảnh được thu thập từ công dân Hàn Quốc và Nhật Bản từ 15 đến 23 tuổi. Chúng được chia thành một bộ đào tạo, mỗi bộ chứa 900 X quang Hàn Quốc và một bộ thử nghiệm nội bộ chứa 857 X quang Nhật Bản. Chúng tôi đã so sánh độ chính xác phân loại và hiệu quả của các phương pháp truyền thống với các bộ thử nghiệm của các mô hình khai thác dữ liệu. Độ chính xác của phương pháp truyền thống trên tập kiểm tra nội bộ cao hơn một chút so với mô hình khai thác dữ liệu và sự khác biệt là nhỏ (lỗi tuyệt đối trung bình <0,21 năm, lỗi bình phương trung bình gốc <0,24 năm). Hiệu suất phân loại cho lần cắt 18 năm cũng tương tự giữa các phương pháp truyền thống và mô hình khai thác dữ liệu. Do đó, các phương pháp truyền thống có thể được thay thế bằng các mô hình khai thác dữ liệu khi thực hiện đánh giá tuổi pháp y bằng cách sử dụng thời gian trưởng thành của răng hàm thứ hai và thứ ba ở thanh thiếu niên Hàn Quốc và thanh niên.
Ước tính tuổi răng được sử dụng rộng rãi trong y học pháp y và nha khoa nhi. Đặc biệt, do mối tương quan cao giữa tuổi theo thời gian và phát triển răng, đánh giá tuổi theo các giai đoạn phát triển nha khoa là một tiêu chí quan trọng để đánh giá tuổi của trẻ em và thanh thiếu niên1,2,3. Tuy nhiên, đối với những người trẻ tuổi, việc ước tính tuổi răng dựa trên sự trưởng thành của nha khoa có những hạn chế của nó vì tăng trưởng răng gần như hoàn tất, ngoại trừ răng hàm thứ ba. Mục đích pháp lý của việc xác định tuổi của những người trẻ tuổi và thanh thiếu niên là cung cấp các ước tính chính xác và bằng chứng khoa học về việc liệu họ có đạt đến độ tuổi của đa số hay không. Trong thực hành pháp lý của thanh thiếu niên và thanh niên ở Hàn Quốc, tuổi được ước tính bằng phương pháp của Lee và ngưỡng hợp pháp là 18 năm được dự đoán dựa trên dữ liệu được báo cáo bởi Oh et al 5.
Học máy là một loại trí tuệ nhân tạo (AI) liên tục học và phân loại một lượng lớn dữ liệu, tự mình giải quyết các vấn đề và điều khiển lập trình dữ liệu. Học máy có thể khám phá các mẫu ẩn hữu ích với khối lượng lớn của Data6. Ngược lại, các phương pháp cổ điển, tốn nhiều công sức và tốn thời gian, có thể có những hạn chế khi xử lý khối lượng lớn dữ liệu phức tạp khó xử lý thủ công7. Do đó, nhiều nghiên cứu đã được thực hiện gần đây bằng cách sử dụng các công nghệ máy tính mới nhất để giảm thiểu lỗi của con người và xử lý hiệu quả dữ liệu đa chiều8,9,10,11,12. Cụ thể, việc học sâu đã được sử dụng rộng rãi trong phân tích hình ảnh y tế và các phương pháp khác nhau để ước tính tuổi bằng cách tự động phân tích X quang đã được báo cáo để cải thiện độ chính xác và hiệu quả của ước tính tuổi13,14,15,16,18,18,19,20 . Ví dụ, Halabi et al 13 đã phát triển một thuật toán học máy dựa trên mạng lưới thần kinh tích chập (CNN) để ước tính tuổi xương bằng cách sử dụng chụp X quang tay trẻ em. Nghiên cứu này đề xuất một mô hình áp dụng học máy cho hình ảnh y tế và cho thấy rằng các phương pháp này có thể cải thiện độ chính xác chẩn đoán. Li et al14 tuổi ước tính tuổi từ hình ảnh tia X xương chậu bằng cách sử dụng CNN học sâu và so sánh chúng với kết quả hồi quy bằng cách sử dụng ước tính giai đoạn hóa thạch. Họ phát hiện ra rằng mô hình CNN học tập sâu cho thấy hiệu suất ước tính tuổi tương tự như mô hình hồi quy truyền thống. Nghiên cứu của Guo et al.
Hầu hết các nghiên cứu về ước tính tuổi sử dụng máy học sử dụng phương pháp học sâu13,14,15,16,17,18,19,20. Ước tính tuổi dựa trên học tập sâu được báo cáo là chính xác hơn các phương pháp truyền thống. Tuy nhiên, phương pháp này cung cấp rất ít cơ hội để trình bày cơ sở khoa học cho các ước tính tuổi, chẳng hạn như các chỉ số tuổi được sử dụng trong các ước tính. Ngoài ra còn có một tranh chấp pháp lý về việc ai tiến hành kiểm tra. Do đó, ước tính tuổi dựa trên học tập sâu rất khó chấp nhận bởi các cơ quan hành chính và tư pháp. Khai thác dữ liệu (DM) là một kỹ thuật có thể khám phá không chỉ được mong đợi mà còn thông tin bất ngờ như một phương pháp để khám phá mối tương quan hữu ích giữa một lượng lớn dữ liệu6,21,22. Học máy thường được sử dụng trong khai thác dữ liệu và cả khai thác dữ liệu và học máy đều sử dụng cùng một thuật toán chính để khám phá các mẫu trong dữ liệu. Ước tính tuổi bằng cách sử dụng sự phát triển của nha khoa dựa trên đánh giá của giám khảo về sự trưởng thành của răng mục tiêu và đánh giá này được thể hiện như một giai đoạn cho mỗi răng mục tiêu. DM có thể được sử dụng để phân tích mối tương quan giữa giai đoạn đánh giá nha khoa và tuổi thực tế và có khả năng thay thế phân tích thống kê truyền thống. Do đó, nếu chúng tôi áp dụng các kỹ thuật DM vào ước tính tuổi, chúng tôi có thể thực hiện học máy trong ước tính tuổi pháp y mà không phải lo lắng về trách nhiệm pháp lý. Một số nghiên cứu so sánh đã được công bố về các lựa chọn thay thế có thể cho các phương pháp thủ công truyền thống được sử dụng trong thực hành pháp y và phương pháp dựa trên EBM để xác định tuổi răng. Shen et al23 cho thấy mô hình DM chính xác hơn so với công thức máy ảnh truyền thống. Galibourg et al24 đã áp dụng các phương pháp DM khác nhau để dự đoán tuổi theo tiêu chí Demirdjian25 và kết quả cho thấy phương pháp DM vượt trội so với các phương pháp Demirdjian và Willems trong việc ước tính tuổi của dân số Pháp.
Để ước tính thời đại nha khoa của thanh thiếu niên Hàn Quốc và thanh niên, Phương pháp 4 của Lee được sử dụng rộng rãi trong thực hành pháp y Hàn Quốc. Phương pháp này sử dụng phân tích thống kê truyền thống (như hồi quy bội) để kiểm tra mối quan hệ giữa các đối tượng Hàn Quốc và tuổi theo thời gian. Trong nghiên cứu này, các phương pháp ước tính tuổi thu được bằng các phương pháp thống kê truyền thống được định nghĩa là các phương pháp truyền thống. Phương pháp của Lee là một phương pháp truyền thống và độ chính xác của nó đã được xác nhận bởi Oh et al. 5; Tuy nhiên, khả năng áp dụng ước tính tuổi dựa trên mô hình DM trong thực hành pháp y Hàn Quốc vẫn còn đáng nghi ngờ. Mục tiêu của chúng tôi là xác nhận một cách khoa học về tính hữu ích tiềm năng của ước tính tuổi dựa trên mô hình DM. Mục đích của nghiên cứu này là (1) để so sánh độ chính xác của hai mô hình DM trong việc ước tính tuổi răng và (2) để so sánh hiệu suất phân loại của 7 mô hình DM ở tuổi 18 và răng hàm thứ ba trong cả hai hàm.
Phương tiện và độ lệch chuẩn của tuổi theo thời gian theo giai đoạn và loại răng được hiển thị trực tuyến trong Bảng bổ trợ S1 (tập huấn luyện), Bảng bổ sung S2 (tập kiểm tra nội bộ) và Bảng bổ trợ S3 (tập kiểm tra ngoài). Các giá trị kappa cho độ tin cậy của interobserver thu được từ tập huấn luyện lần lượt là 0,951 và 0,947. Giá trị P và khoảng tin cậy 95% cho các giá trị kappa được hiển thị trong Bảng bổ sung trực tuyến S4. Giá trị kappa được hiểu là gần như hoàn hảo, phù hợp với các tiêu chí của Landis và Koch26.
Khi so sánh sai số tuyệt đối trung bình (MAE), phương pháp truyền thống hơi vượt trội so với mô hình DM cho tất cả các giới tính và trong bộ thử nghiệm nam bên ngoài, ngoại trừ Perceptron đa lớp (MLP). Sự khác biệt giữa mô hình truyền thống và mô hình DM trên bộ thử nghiệm MAE nội bộ là 0,12 Ném0,19 năm đối với nam và 0,17, 0,21 tuổi đối với phụ nữ. Đối với pin thử nghiệm bên ngoài, sự khác biệt nhỏ hơn (0,001 Ném0,05 tuổi đối với nam và 0,05 Ném0,09 năm đối với phụ nữ). Ngoài ra, lỗi bình phương trung bình gốc (RMSE) thấp hơn một chút so với phương pháp truyền thống, với sự khác biệt nhỏ hơn (0,17 Nott0,24, 0,2 Nott0,24 đối với tập kiểm tra nội bộ nam và 0,03. ). MLP cho thấy hiệu suất tốt hơn một chút so với Perceptron lớp đơn (SLP), ngoại trừ trong trường hợp bộ thử nghiệm bên ngoài nữ. Đối với MAE và RMSE, bộ kiểm tra bên ngoài điểm cao hơn so với tập kiểm tra nội bộ cho tất cả các giới tính và mô hình. Tất cả MAE và RMSE được hiển thị trong Bảng 1 và Hình 1.
MAE và RMSE của các mô hình hồi quy khai thác dữ liệu và truyền thống. MAE lỗi tuyệt đối trung bình, RMSE RMSE trung bình, SLP Perceptron Lớp đơn, Perceptron MLP đa lớp, Phương pháp CM truyền thống.
Hiệu suất phân loại (với mức cắt 18 năm) của các mô hình truyền thống và DM đã được chứng minh về độ nhạy, độ đặc hiệu, giá trị tiên đoán dương (PPV), giá trị dự đoán âm (NPV) và diện tích theo đường cong đặc tính vận hành máy thu (AUROC) 27 (Bảng 2, Hình 2 và Hình 1 trực tuyến Hình 1). Xét về độ nhạy của pin thử nghiệm nội bộ, các phương pháp truyền thống được thực hiện tốt nhất ở nam giới và tệ hơn ở phụ nữ. Tuy nhiên, sự khác biệt về hiệu suất phân loại giữa các phương pháp truyền thống và SD là 9,7% đối với nam giới (MLP) và chỉ 2,4% đối với nữ (XGBOOST). Trong số các mô hình DM, hồi quy logistic (LR) cho thấy độ nhạy tốt hơn ở cả hai giới. Về tính đặc hiệu của bộ thử nghiệm nội bộ, người ta đã quan sát thấy rằng bốn mô hình SD hoạt động tốt ở nam giới, trong khi mô hình truyền thống hoạt động tốt hơn ở nữ. Sự khác biệt về hiệu suất phân loại cho nam và nữ lần lượt là 13,3% (MLP) và 13,1% (MLP), chỉ ra rằng sự khác biệt về hiệu suất phân loại giữa các mô hình vượt quá độ nhạy. Trong số các mô hình DM, máy vector hỗ trợ (SVM), cây quyết định (DT) và các mô hình Random Forest (RF) hoạt động tốt nhất ở nam giới, trong khi mô hình LR hoạt động tốt nhất ở nữ. AUROC của mô hình truyền thống và tất cả các mô hình SD lớn hơn 0,925 (hàng xóm K-Newest (KNN) ở nam giới), thể hiện hiệu suất phân loại tuyệt vời trong việc phân biệt các mẫu 18 tuổi28. Đối với tập kiểm tra bên ngoài, có sự giảm hiệu suất phân loại về độ nhạy, độ đặc hiệu và AUROC so với tập kiểm tra nội bộ. Hơn nữa, sự khác biệt về độ nhạy và độ đặc hiệu giữa hiệu suất phân loại của các mô hình tốt nhất và tồi tệ nhất dao động từ 10% đến 25% và lớn hơn so với sự khác biệt trong tập kiểm tra nội bộ.
Độ nhạy và độ đặc hiệu của các mô hình phân loại khai thác dữ liệu so với các phương pháp truyền thống với mức cắt 18 năm. KNN K Neighbor gần nhất, máy vector hỗ trợ SVM, hồi quy logistic LR, cây quyết định DT, RF Random Forest, XGB XGBOOST, MLP đa lớp Perceptron, phương pháp CM truyền thống.
Bước đầu tiên trong nghiên cứu này là so sánh độ chính xác của các ước tính tuổi răng thu được từ bảy mô hình DM với các mô hình thu được bằng hồi quy truyền thống. MAE và RMSE được đánh giá trong các bộ thử nghiệm nội bộ cho cả hai giới và sự khác biệt giữa phương pháp truyền thống và mô hình DM dao động từ 44 đến 77 ngày đối với MAE và từ 62 đến 88 ngày đối với RMSE. Mặc dù phương pháp truyền thống chính xác hơn một chút trong nghiên cứu này, nhưng rất khó để kết luận liệu một sự khác biệt nhỏ như vậy có ý nghĩa lâm sàng hay thực tế. Những kết quả này chỉ ra rằng độ chính xác của ước tính tuổi răng bằng mô hình DM gần giống như phương pháp truyền thống. So sánh trực tiếp với kết quả từ các nghiên cứu trước đây là khó khăn vì không có nghiên cứu nào so sánh độ chính xác của các mô hình DM với các phương pháp thống kê truyền thống sử dụng cùng một kỹ thuật ghi lại răng trong cùng độ tuổi như trong nghiên cứu này. Galibourg et al24 đã so sánh MAE và RMSE giữa hai phương pháp truyền thống (Phương pháp Demirjian25 và Phương pháp Willems29) và 10 mô hình DM trong dân số Pháp từ 2 đến 24 tuổi. Họ báo cáo rằng tất cả các mô hình DM chính xác hơn các phương pháp truyền thống, với sự khác biệt là 0,20 và 0,38 năm ở MAE và 0,25 và 0,47 năm trong RMSE so với các phương pháp Willems và Demirdjian, tương ứng. Sự khác biệt giữa mô hình SD và các phương pháp truyền thống được thể hiện trong nghiên cứu Halibourg có tính đến nhiều báo cáo30,31,32,33 rằng phương pháp Demirdjian không ước tính chính xác tuổi răng ở dân số khác ngoài người Canada dựa trên nghiên cứu. Trong nghiên cứu này. Tai et al 34 đã sử dụng thuật toán MLP để dự đoán tuổi răng từ 1636 ảnh chỉnh nha Trung Quốc và so sánh độ chính xác của nó với kết quả của phương pháp Demirjian và Willems. Họ báo cáo rằng MLP có độ chính xác cao hơn các phương pháp truyền thống. Sự khác biệt giữa phương pháp Demirdjian và phương pháp truyền thống là <0,32 năm và phương pháp Willems là 0,28 năm, tương tự như kết quả của nghiên cứu hiện tại. Kết quả của các nghiên cứu trước đây24,34 cũng phù hợp với kết quả của nghiên cứu hiện tại và độ chính xác ước tính tuổi của mô hình DM và phương pháp truyền thống là tương tự. Tuy nhiên, dựa trên kết quả được trình bày, chúng ta chỉ có thể thận trọng kết luận rằng việc sử dụng các mô hình DM để ước tính tuổi có thể thay thế các phương pháp hiện có do thiếu các nghiên cứu so sánh và tham khảo trước đây. Các nghiên cứu tiếp theo sử dụng các mẫu lớn hơn là cần thiết để xác nhận kết quả thu được trong nghiên cứu này.
Trong số các nghiên cứu kiểm tra độ chính xác của SD trong việc ước tính tuổi răng, một số cho thấy độ chính xác cao hơn so với nghiên cứu của chúng tôi. Stepanovsky et al 35 đã áp dụng 22 mô hình SD vào X quang toàn cảnh của 976 cư dân Séc từ 2,7 đến 20,5 năm và kiểm tra độ chính xác của từng mô hình. Họ đã đánh giá sự phát triển của tổng cộng 16 răng vĩnh viễn trên và dưới bên trái bằng cách sử dụng các tiêu chí phân loại được đề xuất bởi Moorrees et al 36. MAE dao động từ 0,64 đến 0,94 năm và RMSE dao động từ 0,85 đến 1,27 năm, chính xác hơn so với hai mô hình DM được sử dụng trong nghiên cứu này. Shen et al23 đã sử dụng phương pháp quay phim để ước tính tuổi răng của bảy răng vĩnh viễn ở bên trái bắt buộc ở cư dân miền đông Trung Quốc từ 5 đến 13 tuổi và so sánh nó với độ tuổi ước tính sử dụng hồi quy tuyến tính, SVM và RF. Họ đã chỉ ra rằng cả ba mô hình DM đều có độ chính xác cao hơn so với công thức quay phim truyền thống. MAE và RMSE trong nghiên cứu của Shen thấp hơn so với mô hình DM trong nghiên cứu này. Độ chính xác tăng của các nghiên cứu của Stepanovsky et al. 35 và Shen et al. 23 có thể là do việc đưa các đối tượng trẻ hơn vào các mẫu nghiên cứu của họ. Bởi vì ước tính tuổi cho những người tham gia phát triển răng trở nên chính xác hơn khi số lượng răng tăng trong quá trình phát triển răng, nên độ chính xác của phương pháp ước tính tuổi kết quả có thể bị xâm phạm khi những người tham gia nghiên cứu trẻ hơn. Ngoài ra, lỗi của MLP trong ước tính tuổi nhỏ hơn một chút so với SLP, có nghĩa là MLP chính xác hơn SLP. MLP được coi là tốt hơn một chút để ước tính tuổi, có thể là do các lớp ẩn trong MLP38. Tuy nhiên, có một ngoại lệ cho mẫu bên ngoài của phụ nữ (SLP 1.45, MLP 1.49). Phát hiện rằng MLP chính xác hơn SLP trong việc đánh giá độ tuổi đòi hỏi phải có các nghiên cứu hồi cứu bổ sung.
Hiệu suất phân loại của mô hình DM và phương pháp truyền thống ở ngưỡng 18 năm cũng được so sánh. Tất cả các mô hình SD được thử nghiệm và các phương pháp truyền thống trên bộ thử nghiệm nội bộ cho thấy mức độ phân biệt đối xử thực tế đối với mẫu 18 tuổi. Độ nhạy đối với nam và nữ lớn hơn 87,7% và 94,9%, và độ đặc hiệu lớn hơn 89,3% và 84,7%. AUROC của tất cả các mô hình được thử nghiệm cũng vượt quá 0,925. Theo hiểu biết tốt nhất của chúng tôi, không có nghiên cứu nào kiểm tra hiệu suất của mô hình DM để phân loại 18 năm dựa trên sự trưởng thành của nha khoa. Chúng ta có thể so sánh kết quả của nghiên cứu này với hiệu suất phân loại của các mô hình học tập sâu trên X quang toàn cảnh. Guo et al.15 đã tính toán hiệu suất phân loại của mô hình học sâu dựa trên CNN và phương pháp thủ công dựa trên phương pháp của Demirjian cho một ngưỡng tuổi nhất định. Độ nhạy và độ đặc hiệu của phương pháp thủ công lần lượt là 87,7% và 95,5% và độ nhạy và độ đặc hiệu của mô hình CNN vượt quá 89,2% và 86,6%. Họ kết luận rằng các mô hình học tập sâu có thể thay thế hoặc vượt trội so với đánh giá thủ công trong việc phân loại ngưỡng tuổi. Kết quả của nghiên cứu này cho thấy hiệu suất phân loại tương tự; Người ta tin rằng phân loại bằng các mô hình DM có thể thay thế các phương pháp thống kê truyền thống để ước tính tuổi. Trong số các mô hình, DM LR là mô hình tốt nhất về độ nhạy đối với mẫu nam và độ nhạy và độ đặc hiệu cho mẫu nữ. LR đứng thứ hai về tính đặc hiệu cho nam giới. Hơn nữa, LR được coi là một trong những mẫu DM35 thân thiện với người dùng hơn và ít phức tạp và khó xử lý. Dựa trên những kết quả này, LR được coi là mô hình phân loại cắt tốt nhất cho những người 18 tuổi trong dân số Hàn Quốc.
Nhìn chung, độ chính xác của ước tính tuổi hoặc hiệu suất phân loại trên bộ thử nghiệm bên ngoài kém hoặc thấp hơn so với kết quả trên tập kiểm tra nội bộ. Một số báo cáo chỉ ra rằng độ chính xác hoặc hiệu quả phân loại giảm khi ước tính tuổi dựa trên dân số Hàn Quốc được áp dụng cho dân số Nhật Bản5,39, và một mô hình tương tự đã được tìm thấy trong nghiên cứu hiện tại. Xu hướng suy giảm này cũng được quan sát thấy trong mô hình DM. Do đó, để ước tính chính xác tuổi, ngay cả khi sử dụng DM trong quy trình phân tích, các phương pháp có nguồn gốc từ dữ liệu dân số bản địa, chẳng hạn như phương pháp truyền thống, nên được ưa thích5,39,40,41,42. Vì không rõ liệu các mô hình học tập sâu có thể cho thấy xu hướng tương tự hay không, các nghiên cứu so sánh độ chính xác và hiệu quả của phân loại bằng các phương pháp truyền thống, mô hình DM và các mô hình học tập sâu trên cùng một mẫu là cần thiết để xác nhận liệu trí tuệ nhân tạo có thể vượt qua sự chênh lệch chủng tộc này trong độ tuổi hạn chế hay không. đánh giá.
Chúng tôi chứng minh rằng các phương pháp truyền thống có thể được thay thế bằng ước tính tuổi dựa trên mô hình DM trong thực hành ước tính tuổi pháp y ở Hàn Quốc. Chúng tôi cũng phát hiện ra khả năng thực hiện học máy để đánh giá tuổi pháp y. Tuy nhiên, có những hạn chế rõ ràng, chẳng hạn như không đủ số lượng người tham gia trong nghiên cứu này để xác định chắc chắn kết quả và thiếu các nghiên cứu trước đây để so sánh và xác nhận kết quả của nghiên cứu này. Trong tương lai, các nghiên cứu DM nên được thực hiện với số lượng mẫu lớn hơn và các quần thể đa dạng hơn để cải thiện khả năng ứng dụng thực tế của nó so với các phương pháp truyền thống. Để xác nhận tính khả thi của việc sử dụng trí tuệ nhân tạo để ước tính tuổi trong nhiều quần thể, cần có các nghiên cứu trong tương lai để so sánh độ chính xác phân loại và hiệu quả của DM và các mô hình học tập sâu với các phương pháp truyền thống trong cùng một mẫu.
Nghiên cứu đã sử dụng 2.657 bức ảnh chỉnh hình được thu thập từ người trưởng thành Hàn Quốc và Nhật Bản từ 15 đến 23 tuổi. X quang Hàn Quốc được chia thành 900 bộ đào tạo (19,42 ± 2,65 năm) và 900 bộ thử nghiệm nội bộ (19,52 ± 2,59 năm). Bộ đào tạo được thu thập tại một tổ chức (Bệnh viện Seoul St. Mary), và bộ xét nghiệm riêng được thu thập tại hai tổ chức (Bệnh viện Nha khoa Đại học Quốc gia Seoul và Bệnh viện Nha khoa Đại học Yonsei). Chúng tôi cũng đã thu thập 857 X quang từ một dữ liệu dựa trên dân số khác (Đại học Y khoa IWATE, Nhật Bản) để thử nghiệm bên ngoài. X quang của các đối tượng Nhật Bản (19,31 ± 2,60 năm) đã được chọn làm bộ thử nghiệm bên ngoài. Dữ liệu được thu thập hồi cứu để phân tích các giai đoạn phát triển nha khoa trên X quang toàn cảnh được thực hiện trong quá trình điều trị nha khoa. Tất cả dữ liệu được thu thập là ẩn danh ngoại trừ giới tính, ngày sinh và ngày X quang. Tiêu chí bao gồm và loại trừ giống như các nghiên cứu được công bố trước đây 4, 5. Tuổi thực tế của mẫu được tính toán bằng cách trừ ngày sinh kể từ ngày chụp X quang. Nhóm mẫu được chia thành chín nhóm tuổi. Các phân phối tuổi và giới tính được thể hiện trong Bảng 3 Nghiên cứu này được thực hiện theo Tuyên bố Helsinki và được phê duyệt bởi Ủy ban Đánh giá Thể chế (IRB) của Bệnh viện Seoul St. Mary của Đại học Công giáo Hàn Quốc (KC22WISI0328). Do thiết kế hồi cứu của nghiên cứu này, không thể có được sự đồng ý từ tất cả các bệnh nhân trải qua kiểm tra X quang cho mục đích điều trị. Bệnh viện Đại học Seoul Hàn Quốc (IRB) đã từ bỏ yêu cầu đồng ý.
Các giai đoạn phát triển của răng hàm thứ hai và thứ ba lưỡng bixillary được đánh giá theo tiêu chí Demircan25. Chỉ có một răng được chọn nếu cùng loại răng được tìm thấy ở bên trái và bên phải của mỗi hàm. Nếu răng tương đồng ở cả hai phía ở các giai đoạn phát triển khác nhau, thì răng có giai đoạn phát triển thấp hơn đã được chọn để giải thích cho sự không chắc chắn trong độ tuổi ước tính. Một trăm lần chụp X quang được chọn ngẫu nhiên từ bộ đào tạo được ghi bởi hai nhà quan sát có kinh nghiệm để kiểm tra độ tin cậy của interobserver sau khi hiệu chỉnh trước để xác định giai đoạn trưởng thành răng. Độ tin cậy của intraobserver được đánh giá hai lần trong khoảng thời gian ba tháng bởi người quan sát chính.
Giai đoạn giới tính và phát triển của răng hàm thứ hai và thứ ba của mỗi hàm trong tập huấn luyện được ước tính bởi một người quan sát chính được đào tạo với các mô hình DM khác nhau và tuổi thực tế được đặt làm giá trị mục tiêu. Các mô hình SLP và MLP, được sử dụng rộng rãi trong học máy, đã được thử nghiệm chống lại các thuật toán hồi quy. Mô hình DM kết hợp các chức năng tuyến tính bằng cách sử dụng các giai đoạn phát triển của bốn răng và kết hợp các dữ liệu này để ước tính tuổi. SLP là mạng thần kinh đơn giản nhất và không chứa các lớp ẩn. SLP hoạt động dựa trên truyền ngưỡng giữa các nút. Mô hình SLP trong hồi quy tương tự về mặt toán học với nhiều hồi quy tuyến tính. Không giống như mô hình SLP, mô hình MLP có nhiều lớp ẩn với các hàm kích hoạt phi tuyến. Các thí nghiệm của chúng tôi đã sử dụng một lớp ẩn chỉ có 20 nút ẩn với các hàm kích hoạt phi tuyến. Sử dụng giảm độ dốc làm phương pháp tối ưu hóa và MAE và RMSE làm chức năng mất để đào tạo mô hình học máy của chúng tôi. Mô hình hồi quy thu được tốt nhất đã được áp dụng cho các bộ thử nghiệm bên trong và bên ngoài và tuổi của răng được ước tính.
Một thuật toán phân loại đã được phát triển sử dụng thời gian trưởng thành của bốn răng trong tập huấn luyện để dự đoán liệu một mẫu có 18 tuổi hay không. Để xây dựng mô hình, chúng tôi đã lấy được bảy thuật toán học máy đại diện6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST và (7) MLP . LR là một trong những thuật toán phân loại được sử dụng rộng rãi nhất44. Đó là một thuật toán học tập được giám sát sử dụng hồi quy để dự đoán xác suất dữ liệu thuộc về một danh mục nhất định từ 0 đến 1 và phân loại dữ liệu thuộc loại có khả năng hơn dựa trên xác suất này; Chủ yếu được sử dụng để phân loại nhị phân. KNN là một trong những thuật toán học máy đơn giản nhất45. Khi được cung cấp dữ liệu đầu vào mới, nó tìm thấy dữ liệu k gần với tập hợp hiện tại và sau đó phân loại chúng thành lớp với tần số cao nhất. Chúng tôi đặt 3 cho số lượng hàng xóm được xem xét (k). SVM là một thuật toán tối đa hóa khoảng cách giữa hai lớp bằng cách sử dụng hàm kernel để mở rộng không gian tuyến tính thành một không gian phi tuyến tính gọi là fields46. Đối với mô hình này, chúng tôi sử dụng BIAS = 1, Power = 1 và Gamma = 1 làm Hyperparameter cho hạt nhân đa thức. DT đã được áp dụng trong các trường khác nhau như một thuật toán để chia toàn bộ dữ liệu được đặt thành một số nhóm nhỏ bằng cách biểu diễn các quy tắc quyết định trong cấu trúc cây47. Mô hình được cấu hình với số lượng bản ghi tối thiểu trên mỗi nút là 2 và sử dụng chỉ số Gini làm thước đo chất lượng. RF là một phương pháp hòa tấu kết hợp nhiều DT để cải thiện hiệu suất bằng phương pháp tập hợp bootstrap tạo ra bộ phân loại yếu cho mỗi mẫu bằng cách vẽ ngẫu nhiên các mẫu có cùng kích thước nhiều lần từ bộ dữ liệu ban đầu48. Chúng tôi đã sử dụng 100 cây, độ sâu 10 cây, kích thước nút tối thiểu 1 và chỉ số phụ gia Gini làm tiêu chí tách nút. Việc phân loại dữ liệu mới được xác định bởi một cuộc bỏ phiếu đa số. XGBOOST là một thuật toán kết hợp các kỹ thuật tăng cường bằng cách sử dụng một phương pháp lấy dữ liệu đào tạo lỗi giữa các giá trị thực tế và dự đoán của mô hình trước đó và làm tăng lỗi bằng gradient49. Đây là một thuật toán được sử dụng rộng rãi do hiệu suất và hiệu quả tài nguyên tốt của nó, cũng như độ tin cậy cao như là một hàm điều chỉnh quá mức. Mô hình được trang bị 400 bánh xe hỗ trợ. MLP là một mạng lưới thần kinh trong đó một hoặc nhiều perceprons tạo thành nhiều lớp với một hoặc nhiều lớp ẩn giữa các lớp đầu vào và đầu ra38. Sử dụng điều này, bạn có thể thực hiện phân loại phi tuyến tính khi bạn thêm một lớp đầu vào và nhận giá trị kết quả, giá trị kết quả dự đoán được so sánh với giá trị kết quả thực tế và lỗi được truyền lại. Chúng tôi đã tạo ra một lớp ẩn với 20 tế bào thần kinh ẩn trong mỗi lớp. Mỗi mô hình chúng tôi phát triển được áp dụng cho các bộ bên trong và bên ngoài để kiểm tra hiệu suất phân loại bằng cách tính toán độ nhạy, độ đặc hiệu, PPV, NPV và AUROC. Độ nhạy được định nghĩa là tỷ lệ của một mẫu ước tính là từ 18 tuổi trở lên so với mẫu ước tính là 18 tuổi trở lên. Tính đặc hiệu là tỷ lệ của các mẫu dưới 18 tuổi và những người ước tính dưới 18 tuổi.
Các giai đoạn nha khoa được đánh giá trong bộ đào tạo đã được chuyển đổi thành các giai đoạn số để phân tích thống kê. Hồi quy tuyến tính và logistic đa biến được thực hiện để phát triển các mô hình dự đoán cho từng công thức hồi quy giới tính và có thể sử dụng để ước tính tuổi. Chúng tôi đã sử dụng các công thức này để ước tính tuổi răng cho cả bộ thử nghiệm bên trong và bên ngoài. Bảng 4 cho thấy các mô hình hồi quy và phân loại được sử dụng trong nghiên cứu này.
Độ tin cậy của interobserver được tính toán bằng thống kê Kappa của Cohen. Để kiểm tra độ chính xác của DM và các mô hình hồi quy truyền thống, chúng tôi đã tính toán MAE và RMSE bằng cách sử dụng độ tuổi ước tính và thực tế của các bộ thử nghiệm bên trong và bên ngoài. Những lỗi này thường được sử dụng để đánh giá độ chính xác của dự đoán mô hình. Lỗi càng nhỏ, độ chính xác của dự báo24 càng cao. So sánh MAE và RMSE của các bộ kiểm tra bên trong và bên ngoài được tính toán bằng DM và hồi quy truyền thống. Hiệu suất phân loại của việc cắt giảm 18 năm trong các thống kê truyền thống được đánh giá bằng cách sử dụng bảng dự phòng 2 × 2. Độ nhạy, độ đặc hiệu, PPV, NPV và AUROC được tính toán của tập kiểm tra được so sánh với các giá trị đo của mô hình phân loại DM. Dữ liệu được biểu thị dưới dạng trung bình ± độ lệch chuẩn hoặc số (%) tùy thuộc vào đặc điểm dữ liệu. Giá trị p hai mặt <0,05 được coi là có ý nghĩa thống kê. Tất cả các phân tích thống kê thông thường đã được thực hiện bằng SAS phiên bản 9.4 (Viện SAS, Cary, NC). Mô hình hồi quy DM đã được triển khai trong Python bằng cách sử dụng Keras50 2.2.4 phụ trợ và TensorFlow51 1.8.0 dành riêng cho các hoạt động toán học. Mô hình phân loại DM đã được triển khai trong môi trường phân tích kiến thức Waikato và Nền tảng phân tích thông tin Konstanz (KNIME) 4.6.152.
Các tác giả thừa nhận rằng dữ liệu hỗ trợ kết luận của nghiên cứu có thể được tìm thấy trong bài viết và tài liệu bổ sung. Các bộ dữ liệu được tạo và/hoặc phân tích trong nghiên cứu có sẵn từ tác giả tương ứng theo yêu cầu hợp lý.
Ritz-Timme, S. et al. Đánh giá độ tuổi: Trạng thái của nghệ thuật để đáp ứng các yêu cầu cụ thể của thực hành pháp y. thực tập. J. Y học pháp lý. 113, 129 bóng136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., và Oleze, A. Tình trạng hiện tại của đánh giá tuổi pháp y của các đối tượng sống cho mục đích truy tố hình sự. Pháp y. thuốc. Bệnh lý. 1, 239 bóng246 (2005).
Pan, J. et al. Một phương pháp sửa đổi để đánh giá tuổi răng của trẻ em từ 5 đến 16 tuổi ở miền đông Trung Quốc. lâm sàng. Khảo sát bằng miệng. 25, 3463 Từ3474 (2021).
Lee, SS, v.v ... Thời gian phát triển răng hàm thứ hai và thứ ba ở Hàn Quốc và ứng dụng của nó để đánh giá tuổi pháp y. thực tập. J. Y học pháp lý. 124, 659 Từ665 (2010).
Oh, S., Kumagai, A., Kim, Sy và Lee, SS Độ chính xác của ước tính tuổi và ước tính ngưỡng 18 năm dựa trên sự trưởng thành của răng hàm thứ hai và thứ ba ở Hàn Quốc và Nhật Bản. PLOS ONE 17, E0271247 (2022).
Kim, Jy, et al. Phân tích dữ liệu dựa trên máy học trước phẫu thuật có thể dự đoán kết quả điều trị phẫu thuật giấc ngủ ở bệnh nhân mắc OSA. Khoa học. Báo cáo 11, 14911 (2021).
Han, M. et al. Ước tính tuổi chính xác từ học máy có hoặc không có sự can thiệp của con người? thực tập. J. Y học pháp lý. 136, 821 bóng831 (2022).
Khan, S. và Shaheen, M. Từ khai thác dữ liệu đến khai thác dữ liệu. J.information. Khoa học. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. và Shaheen, M. Wisrule: Thuật toán nhận thức đầu tiên để khai thác quy tắc liên kết. J.information. Khoa học. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. và Abdullah U. Karm: Khai thác dữ liệu truyền thống dựa trên các quy tắc liên kết dựa trên bối cảnh. tính toán. Matt. Tiếp tục. 68, 3305 Từ3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. và Habib M. Phát hiện sự tương đồng về ngữ nghĩa dựa trên học tập sâu bằng dữ liệu văn bản. thông báo. công nghệ. điều khiển. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. và Shahin, M. Một hệ thống nhận ra hoạt động trong các video thể thao. Đa phương tiện. Các ứng dụng công cụ https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al. Thử thách học máy RSNA trong thời đại xương nhi. X quang 290, 498 Từ503 (2019).
Li, Y. et al. Ước tính tuổi pháp y từ tia X xương chậu bằng cách sử dụng học tập sâu. EURO. bức xạ. 29, 2322 Từ2329 (2019).
Guo, YC, et al. Phân loại tuổi chính xác bằng cách sử dụng các phương pháp thủ công và mạng lưới thần kinh tích chập sâu từ hình ảnh chiếu chính hình. thực tập. J. Y học pháp lý. 135, 1589 Từ1597 (2021).
Alabama Dalora et al. Ước tính tuổi xương bằng các phương pháp học máy khác nhau: Đánh giá tài liệu có hệ thống và phân tích tổng hợp. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. và Yang, J. Ước tính tuổi theo dân số của người Mỹ gốc Phi và người Trung Quốc dựa trên khối lượng buồng tủy của răng hàm đầu tiên bằng cách sử dụng chụp cắt lớp vi tính chùm tia. thực tập. J. Y học pháp lý. 136, 811 bóng819 (2022).
Kim S., Lee YH, Noh YK, Park FK và OH KS xác định các nhóm tuổi của người sống bằng hình ảnh dựa trên trí tuệ nhân tạo của răng hàm đầu tiên. Khoa học. Báo cáo 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. và Urschler, M. Ước tính tuổi tự động và phân loại độ tuổi đa số từ dữ liệu MRI đa biến. IEEE J. BIOMED. Cảnh báo sức khỏe. 23, 1392 Từ1403 (2019).
Cheng, Q., Ge, Z., Du, H. và Li, G. Ước tính tuổi dựa trên phân đoạn buồng bột giấy 3D của răng hàm đầu tiên từ chụp cắt lớp hình nón bằng cách tích hợp các bộ học tập sâu và cấp độ. thực tập. J. Y học pháp lý. 135, 365 bóng373 (2021).
Wu, WT, et al. Khai thác dữ liệu trong Dữ liệu lớn lâm sàng: Cơ sở dữ liệu, các bước và phương pháp phổ biến. Thế giới. thuốc. tài nguyên. 8, 44 (2021).
Yang, J. et al. Giới thiệu về cơ sở dữ liệu y tế và công nghệ khai thác dữ liệu trong kỷ nguyên dữ liệu lớn. J. Avid. Y học cơ bản. 13, 57 bóng69 (2020).
Shen, S. et al. Phương pháp của người quay để ước tính tuổi răng bằng cách sử dụng máy học. BMC Sức khỏe răng miệng 21, 641 (2021).
Galliburg A. et al. So sánh các phương pháp học máy khác nhau để dự đoán tuổi nha khoa bằng phương pháp dàn Demirdjian. thực tập. J. Y học pháp lý. 135, 665 bóng675 (2021).
Demirdjian, A., Goldstein, H. và Tanner, JM Một hệ thống mới để đánh giá tuổi răng. khịt mũi. sinh vật học. 45, 211 bóng227 (1973).
Landis, Jr và Koch, GG Các biện pháp thỏa thuận quan sát viên về dữ liệu phân loại. Sinh trắc học 33, 159 Từ174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK và Choi HK. Phân tích kết cấu, hình thái và thống kê của hình ảnh cộng hưởng từ hai chiều bằng cách sử dụng các kỹ thuật trí tuệ nhân tạo để phân biệt các khối u não nguyên phát. Thông tin sức khỏe. tài nguyên. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Thời gian đăng: Tháng 1-04-2024