Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Cảm ơn bạn đã ghé thăm Nature.com.Phiên bản trình duyệt bạn đang sử dụng có hỗ trợ CSS hạn chế.Để có kết quả tốt nhất, chúng tôi khuyên bạn nên sử dụng phiên bản trình duyệt mới hơn (hoặc tắt chế độ tương thích trong Internet Explorer).Trong thời gian chờ đợi, để đảm bảo được hỗ trợ liên tục, chúng tôi đang hiển thị trang web mà không có kiểu dáng hoặc JavaScript.
Răng được coi là thước đo chính xác nhất về tuổi của cơ thể con người và thường được sử dụng trong giám định tuổi của pháp y.Chúng tôi nhằm mục đích xác thực ước tính tuổi răng dựa trên khai thác dữ liệu bằng cách so sánh độ chính xác ước tính và hiệu suất phân loại của ngưỡng 18 năm với các phương pháp truyền thống và ước tính tuổi dựa trên khai thác dữ liệu.Tổng cộng có 2657 ảnh chụp X quang toàn cảnh được thu thập từ các công dân Hàn Quốc và Nhật Bản từ 15 đến 23 tuổi.Họ được chia thành một bộ huấn luyện, mỗi bộ chứa 900 bức ảnh X quang của Hàn Quốc và một bộ thử nghiệm nội bộ chứa 857 bức ảnh X quang của Nhật Bản.Chúng tôi đã so sánh độ chính xác và hiệu quả phân loại của các phương pháp truyền thống với các bộ thử nghiệm của mô hình khai thác dữ liệu.Độ chính xác của phương pháp truyền thống trên bộ thử nghiệm nội bộ cao hơn một chút so với mô hình khai thác dữ liệu và chênh lệch nhỏ (sai số tuyệt đối trung bình <0,21 năm, sai số bình phương trung bình gốc <0,24 năm).Hiệu suất phân loại đối với thời điểm 18 năm cũng tương tự giữa các phương pháp truyền thống và mô hình khai thác dữ liệu.Do đó, các phương pháp truyền thống có thể được thay thế bằng các mô hình khai thác dữ liệu khi thực hiện đánh giá độ tuổi pháp y bằng cách sử dụng độ trưởng thành của răng hàm thứ hai và thứ ba ở thanh thiếu niên và thanh niên Hàn Quốc.
Ước tính tuổi răng được sử dụng rộng rãi trong y học pháp y và nha khoa nhi.Đặc biệt, do có mối tương quan cao giữa tuổi theo thời gian và sự phát triển răng nên việc đánh giá tuổi theo các giai đoạn phát triển răng là tiêu chí quan trọng để đánh giá tuổi trẻ em và thanh thiếu niên1,2,3.Tuy nhiên, đối với người trẻ, việc ước tính tuổi răng dựa vào độ trưởng thành của răng có những hạn chế vì răng đã phát triển gần như hoàn chỉnh, ngoại trừ các răng hàm thứ ba.Mục đích pháp lý của việc xác định độ tuổi của thanh niên và thanh thiếu niên là để đưa ra ước tính chính xác và bằng chứng khoa học về việc họ đã đến tuổi thành niên hay chưa.Trong thực tiễn pháp lý y tế của thanh thiếu niên và thanh niên ở Hàn Quốc, tuổi được ước tính bằng phương pháp của Lee và ngưỡng pháp lý là 18 tuổi được dự đoán dựa trên dữ liệu được báo cáo bởi Oh và cộng sự 5.
Học máy là một loại trí tuệ nhân tạo (AI) liên tục học và phân loại lượng lớn dữ liệu, tự giải quyết vấn đề và thúc đẩy lập trình dữ liệu.Học máy có thể khám phá các mẫu ẩn hữu ích trong khối lượng lớn dữ liệu6.Ngược lại, các phương pháp cổ điển tốn nhiều công sức và thời gian có thể có những hạn chế khi xử lý khối lượng lớn dữ liệu phức tạp, khó xử lý thủ công7.Do đó, nhiều nghiên cứu đã được thực hiện gần đây bằng cách sử dụng các công nghệ máy tính mới nhất để giảm thiểu lỗi của con người và xử lý dữ liệu đa chiều một cách hiệu quả8,9,10,11,12.Đặc biệt, deep learning đã được sử dụng rộng rãi trong phân tích hình ảnh y tế và nhiều phương pháp ước tính tuổi bằng cách tự động phân tích ảnh X quang đã được báo cáo để cải thiện độ chính xác và hiệu quả của việc ước tính tuổi13,14,15,16,17,18,19,20 .Ví dụ, Halabi và cộng sự đã phát triển thuật toán học máy dựa trên mạng lưới thần kinh tích chập (CNN) để ước tính tuổi xương bằng cách sử dụng ảnh chụp X quang bàn tay của trẻ em.Nghiên cứu này đề xuất một mô hình áp dụng học máy vào hình ảnh y tế và cho thấy những phương pháp này có thể cải thiện độ chính xác của chẩn đoán.Li và cộng sự14 ước tính độ tuổi từ hình ảnh X-quang vùng chậu bằng cách sử dụng CNN học sâu và so sánh chúng với kết quả hồi quy bằng cách sử dụng ước tính giai đoạn cốt hóa.Họ nhận thấy rằng mô hình CNN học sâu cho thấy hiệu suất ước tính độ tuổi tương tự như mô hình hồi quy truyền thống.Nghiên cứu của Guo và cộng sự [15] đã đánh giá hiệu suất phân loại độ tuổi chấp nhận của công nghệ CNN dựa trên ảnh chỉnh hình nha khoa và kết quả của mô hình CNN đã chứng minh rằng con người vượt trội hơn hiệu suất phân loại độ tuổi của nó.
Hầu hết các nghiên cứu về ước tính độ tuổi bằng máy học đều sử dụng phương pháp học sâu13,14,15,16,17,18,19,20.Ước tính độ tuổi dựa trên deep learning được báo cáo là chính xác hơn các phương pháp truyền thống.Tuy nhiên, cách tiếp cận này mang lại rất ít cơ hội trình bày cơ sở khoa học cho việc ước tính độ tuổi, chẳng hạn như các chỉ số tuổi được sử dụng trong ước tính.Ngoài ra còn có tranh chấp pháp lý về việc ai tiến hành thanh tra.Vì vậy, việc ước lượng độ tuổi dựa trên deep learning khó được các cơ quan hành chính và tư pháp chấp nhận.Khai thác dữ liệu (DM) là một kỹ thuật có thể khám phá không chỉ những thông tin được mong đợi mà còn cả những thông tin không mong đợi như một phương pháp khám phá những mối tương quan hữu ích giữa một lượng lớn dữ liệu6,21,22.Học máy thường được sử dụng trong khai thác dữ liệu và cả khai thác dữ liệu và học máy đều sử dụng các thuật toán chính giống nhau để khám phá các mẫu trong dữ liệu.Ước tính tuổi bằng cách sử dụng sự phát triển răng dựa trên đánh giá của người kiểm tra về độ trưởng thành của răng mục tiêu và đánh giá này được thể hiện dưới dạng giai đoạn cho từng răng mục tiêu.DM có thể được sử dụng để phân tích mối tương quan giữa giai đoạn đánh giá răng và tuổi thực tế và có khả năng thay thế phân tích thống kê truyền thống.Do đó, nếu áp dụng kỹ thuật DM để ước tính độ tuổi, chúng ta có thể triển khai máy học trong ước tính độ tuổi pháp y mà không phải lo lắng về trách nhiệm pháp lý.Một số nghiên cứu so sánh đã được công bố về các phương pháp thay thế khả thi cho các phương pháp thủ công truyền thống được sử dụng trong thực hành pháp y và các phương pháp dựa trên EBM để xác định tuổi răng.Shen và cộng sự23 cho thấy mô hình DM chính xác hơn công thức Camerer truyền thống.Galibourg và cộng sự24 đã áp dụng các phương pháp DM khác nhau để dự đoán tuổi theo tiêu chí Demirdjian25 và kết quả cho thấy phương pháp DM vượt trội hơn phương pháp Demirdjian và Willems trong việc ước tính tuổi của dân số Pháp.
Để ước tính tuổi răng của thanh thiếu niên và thanh niên Hàn Quốc, phương pháp 4 của Lee được sử dụng rộng rãi trong thực hành pháp y Hàn Quốc.Phương pháp này sử dụng phân tích thống kê truyền thống (chẳng hạn như hồi quy bội) để kiểm tra mối quan hệ giữa các đối tượng tiếng Hàn và tuổi theo thời gian.Trong nghiên cứu này, các phương pháp ước tính độ tuổi thu được bằng các phương pháp thống kê truyền thống được định nghĩa là “các phương pháp truyền thống”.Phương pháp của Lee là phương pháp truyền thống và độ chính xác của nó đã được Oh et al.5;tuy nhiên, khả năng áp dụng ước tính độ tuổi dựa trên mô hình DM trong thực hành pháp y Hàn Quốc vẫn còn nhiều nghi vấn.Mục tiêu của chúng tôi là xác nhận một cách khoa học tính hữu ích tiềm tàng của việc ước tính độ tuổi dựa trên mô hình DM.Mục đích của nghiên cứu này là (1) so sánh độ chính xác của hai mô hình DM trong việc ước tính tuổi răng và (2) so sánh hiệu suất phân loại của 7 mô hình DM ở độ tuổi 18 với những mô hình thu được bằng phương pháp thống kê truyền thống. và răng hàm thứ ba ở cả hai hàm.
Các phương tiện và độ lệch chuẩn của tuổi theo thời gian theo giai đoạn và loại răng được hiển thị trực tuyến trong Bảng bổ trợ S1 (bộ huấn luyện), Bảng bổ trợ S2 (bộ kiểm tra nội bộ) và Bảng bổ trợ S3 (bộ kiểm tra bên ngoài).Giá trị kappa cho độ tin cậy trong máy chủ và giữa các máy chủ thu được từ tập huấn luyện lần lượt là 0,951 và 0,947.Giá trị P và khoảng tin cậy 95% cho giá trị kappa được hiển thị trong bảng bổ sung trực tuyến S4.Giá trị kappa được hiểu là “gần như hoàn hảo”, phù hợp với tiêu chí của Landis và Koch26.
Khi so sánh sai số tuyệt đối trung bình (MAE), phương pháp truyền thống vượt trội hơn một chút so với mô hình DM đối với tất cả giới tính và trong bộ thử nghiệm nam bên ngoài, ngoại trừ perceptron đa lớp (MLP).Sự khác biệt giữa mô hình truyền thống và mô hình DM trên bộ thử nghiệm MAE nội bộ là 0,12–0,19 năm đối với nam và 0,17–0,21 năm đối với nữ.Đối với pin thử nghiệm bên ngoài, sự khác biệt nhỏ hơn (0,001–0,05 năm đối với nam và 0,05–0,09 năm đối với nữ).Ngoài ra, sai số bình phương trung bình gốc (RMSE) thấp hơn một chút so với phương pháp truyền thống, với chênh lệch nhỏ hơn (0,17–0,24, 0,2–0,24 đối với bộ kiểm tra nội bộ nam và 0,03–0,07, 0,04–0,08 đối với bộ kiểm tra bên ngoài).).MLP cho thấy hiệu suất tốt hơn một chút so với Perceptron một lớp (SLP), ngoại trừ trường hợp bộ thử nghiệm bên ngoài dành cho nữ.Đối với MAE và RMSE, bộ kiểm tra bên ngoài đạt điểm cao hơn bộ kiểm tra nội bộ cho tất cả giới tính và người mẫu.Tất cả MAE và RMSE được thể hiện trong Bảng 1 và Hình 1.
MAE và RMSE của các mô hình hồi quy khai thác dữ liệu và truyền thống.Sai số tuyệt đối trung bình MAE, sai số bình phương trung bình gốc RMSE, perceptron SLP một lớp, perceptron đa lớp MLP, phương pháp CM truyền thống.
Hiệu suất phân loại (với thời gian cắt là 18 năm) của mô hình truyền thống và DM đã được thể hiện về độ nhạy, độ đặc hiệu, giá trị tiên đoán dương (PPV), giá trị tiên đoán âm (NPV) và diện tích dưới đường cong đặc tính vận hành máy thu (AUROC) 27 (Bảng 2, Hình 2 và Hình 1 bổ sung trực tuyến).Xét về độ nhạy của pin thử nghiệm bên trong, các phương pháp truyền thống hoạt động tốt nhất ở nam giới và kém hơn ở phụ nữ.Tuy nhiên, sự khác biệt về hiệu suất phân loại giữa các phương pháp truyền thống và SD là 9,7% đối với nam (MLP) và chỉ 2,4% đối với nữ (XGBoost).Trong số các mô hình DM, hồi quy logistic (LR) cho thấy độ nhạy tốt hơn ở cả hai giới.Về tính đặc hiệu của bộ thử nghiệm nội bộ, người ta nhận thấy rằng bốn mẫu SD hoạt động tốt ở nam giới, trong khi mô hình truyền thống hoạt động tốt hơn ở nữ giới.Sự khác biệt về hiệu suất phân loại giữa nam và nữ lần lượt là 13,3% (MLP) và 13,1% (MLP), cho thấy sự khác biệt về hiệu suất phân loại giữa các mô hình vượt quá độ nhạy.Trong số các mô hình DM, mô hình máy vectơ hỗ trợ (SVM), cây quyết định (DT) và rừng ngẫu nhiên (RF) hoạt động tốt nhất ở nam giới, trong khi mô hình LR hoạt động tốt nhất ở nữ giới.AUROC của mô hình truyền thống và tất cả các mô hình SD đều lớn hơn 0,925 (k-hàng xóm gần nhất (KNN) ở nam giới), thể hiện hiệu suất phân loại xuất sắc trong việc phân biệt các mẫu 18 tuổi28.Đối với bộ thử nghiệm bên ngoài, hiệu suất phân loại về độ nhạy, độ đặc hiệu và AUROC đã giảm so với bộ thử nghiệm nội bộ.Hơn nữa, sự khác biệt về độ nhạy và độ đặc hiệu giữa hiệu suất phân loại của mô hình tốt nhất và kém nhất nằm trong khoảng từ 10% đến 25% và lớn hơn sự khác biệt trong bộ thử nghiệm nội bộ.
Độ nhạy và độ đặc hiệu của mô hình phân loại khai thác dữ liệu so với các phương pháp truyền thống với thời gian cắt là 18 năm.KNN k hàng xóm gần nhất, máy vectơ hỗ trợ SVM, hồi quy logistic LR, cây quyết định DT, rừng ngẫu nhiên RF, XGB XGBoost, perceptron đa lớp MLP, phương pháp CM truyền thống.
Bước đầu tiên trong nghiên cứu này là so sánh độ chính xác của ước tính tuổi răng thu được từ bảy mô hình DM với mô hình thu được bằng phương pháp hồi quy truyền thống.MAE và RMSE đã được đánh giá trong các bộ thử nghiệm nội bộ cho cả hai giới và sự khác biệt giữa phương pháp truyền thống và mô hình DM dao động từ 44 đến 77 ngày đối với MAE và từ 62 đến 88 ngày đối với RMSE.Mặc dù phương pháp truyền thống chính xác hơn một chút trong nghiên cứu này nhưng rất khó để kết luận liệu sự khác biệt nhỏ như vậy có ý nghĩa lâm sàng hay thực tế hay không.Những kết quả này cho thấy độ chính xác của việc ước tính tuổi răng bằng mô hình DM gần như tương đương với phương pháp truyền thống.Việc so sánh trực tiếp với kết quả từ các nghiên cứu trước đây là khó khăn vì chưa có nghiên cứu nào so sánh độ chính xác của mô hình DM với các phương pháp thống kê truyền thống sử dụng cùng kỹ thuật ghi răng ở cùng độ tuổi như trong nghiên cứu này.Galibourg và cộng sự24 đã so sánh MAE và RMSE giữa hai phương pháp truyền thống (phương pháp Demirjian25 và phương pháp Willems29) và 10 mô hình DM ở dân số Pháp từ 2 đến 24 tuổi.Họ báo cáo rằng tất cả các mô hình DM đều chính xác hơn các phương pháp truyền thống, với sự khác biệt lần lượt là 0,20 và 0,38 năm ở MAE và 0,25 và 0,47 năm ở RMSE so với các phương pháp Willems và Demirdjian.Sự khác biệt giữa mô hình SD và các phương pháp truyền thống được thể hiện trong nghiên cứu Halibourg đã tính đến nhiều báo cáo30,31,32,33 rằng phương pháp Demirdjian không ước tính chính xác tuổi răng ở các quần thể khác ngoài người Canada gốc Pháp mà nghiên cứu dựa trên.trong nghiên cứu này.Tai và cộng sự đã sử dụng thuật toán MLP để dự đoán tuổi răng từ 1636 bức ảnh chỉnh nha của Trung Quốc và so sánh độ chính xác của nó với kết quả của phương pháp Demirjian và Willems.Họ báo cáo rằng MLP có độ chính xác cao hơn các phương pháp truyền thống.Sự khác biệt giữa phương pháp Demirdjian và phương pháp truyền thống là <0,32 năm và phương pháp Willems là 0,28 năm, tương tự với kết quả của nghiên cứu này.Kết quả của các nghiên cứu trước đây24,34 cũng phù hợp với kết quả của nghiên cứu hiện tại và độ chính xác ước tính độ tuổi của mô hình DM và phương pháp truyền thống là tương tự nhau.Tuy nhiên, dựa trên các kết quả được trình bày, chúng tôi chỉ có thể kết luận một cách thận trọng rằng việc sử dụng mô hình DM để ước tính tuổi có thể thay thế các phương pháp hiện có do thiếu các nghiên cứu so sánh và tham khảo trước đó.Cần có các nghiên cứu tiếp theo sử dụng mẫu lớn hơn để xác nhận kết quả thu được trong nghiên cứu này.
Trong số các nghiên cứu kiểm tra tính chính xác của SD trong việc ước tính tuổi răng, một số nghiên cứu cho thấy độ chính xác cao hơn nghiên cứu của chúng tôi.Stepanovsky và cộng sự đã áp dụng 22 mô hình SD để chụp X quang toàn cảnh của 976 cư dân Séc từ 2,7 đến 20,5 tuổi và kiểm tra độ chính xác của từng mô hình.Họ đánh giá sự phát triển của tổng cộng 16 răng vĩnh viễn hàm trên và hàm dưới bên trái bằng cách sử dụng tiêu chí phân loại do Moorrees và cộng sự đề xuất.MAE dao động từ 0,64 đến 0,94 năm và RMSE dao động từ 0,85 đến 1,27 năm, chính xác hơn hai mô hình DM được sử dụng trong nghiên cứu này.Shen và cộng sự23 đã sử dụng phương pháp Cameriere để ước tính tuổi răng của bảy chiếc răng vĩnh viễn ở hàm dưới bên trái ở cư dân miền Đông Trung Quốc từ 5 đến 13 tuổi và so sánh với độ tuổi ước tính bằng phương pháp hồi quy tuyến tính, SVM và RF.Họ cho thấy cả ba mô hình DM đều có độ chính xác cao hơn so với công thức Cameriere truyền thống.MAE và RMSE trong nghiên cứu của Shen thấp hơn so với mô hình DM trong nghiên cứu này.Độ chính xác ngày càng tăng của các nghiên cứu của Stepanovsky et al.35 và Shen và cộng sự.23 có thể là do việc đưa các đối tượng trẻ tuổi vào mẫu nghiên cứu của họ.Bởi vì ước tính độ tuổi của những người tham gia có răng đang phát triển trở nên chính xác hơn khi số lượng răng tăng lên trong quá trình phát triển răng, nên độ chính xác của phương pháp ước tính tuổi thu được có thể bị ảnh hưởng khi những người tham gia nghiên cứu còn trẻ hơn.Ngoài ra, sai số của MLP trong ước tính độ tuổi nhỏ hơn một chút so với SLP, nghĩa là MLP chính xác hơn SLP.MLP được coi là tốt hơn một chút trong việc ước tính độ tuổi, có thể do các lớp ẩn trong MLP38.Tuy nhiên, có một ngoại lệ đối với mẫu bên ngoài là phụ nữ (SLP 1,45, MLP 1,49).Việc phát hiện rằng MLP chính xác hơn SLP trong việc đánh giá độ tuổi đòi hỏi các nghiên cứu hồi cứu bổ sung.
Hiệu suất phân loại của mô hình DM và phương pháp truyền thống ở ngưỡng 18 năm cũng được so sánh.Tất cả các mẫu SD được thử nghiệm và các phương pháp truyền thống trên bộ thử nghiệm nội bộ đều cho thấy mức độ phân biệt đối xử thực tế có thể chấp nhận được đối với mẫu 18 tuổi.Độ nhạy ở nam và nữ lần lượt lớn hơn 87,7% và 94,9%, độ đặc hiệu lớn hơn 89,3% và 84,7%.AUROC của tất cả các mẫu được thử nghiệm cũng vượt quá 0,925.Theo hiểu biết tốt nhất của chúng tôi, không có nghiên cứu nào kiểm tra hiệu suất của mô hình DM để phân loại 18 năm dựa trên độ trưởng thành của răng.Chúng ta có thể so sánh kết quả của nghiên cứu này với hiệu suất phân loại của các mô hình học sâu trên ảnh chụp X quang toàn cảnh.Guo và cộng sự15 đã tính toán hiệu suất phân loại của mô hình học sâu dựa trên CNN và phương pháp thủ công dựa trên phương pháp của Demirjian cho một ngưỡng độ tuổi nhất định.Độ nhạy và độ đặc hiệu của phương pháp thủ công lần lượt là 87,7% và 95,5%, độ nhạy và độ đặc hiệu của mô hình CNN lần lượt vượt quá 89,2% và 86,6%.Họ kết luận rằng các mô hình học sâu có thể thay thế hoặc vượt trội hơn việc đánh giá thủ công trong việc phân loại ngưỡng tuổi.Kết quả của nghiên cứu này cho thấy hiệu suất phân loại tương tự;Người ta tin rằng việc phân loại bằng mô hình DM có thể thay thế các phương pháp thống kê truyền thống để ước tính độ tuổi.Trong số các mô hình, DM LR là mô hình tốt nhất về độ nhạy đối với mẫu nam cũng như độ nhạy và độ đặc hiệu đối với mẫu nữ.LR đứng thứ hai về độ đặc hiệu đối với nam giới.Hơn nữa, LR được coi là một trong những mẫu DM35 thân thiện với người dùng hơn và ít phức tạp và khó xử lý hơn.Dựa trên những kết quả này, LR được coi là mô hình phân loại điểm cắt tốt nhất cho độ tuổi 18 trong dân số Hàn Quốc.
Nhìn chung, độ chính xác của ước tính độ tuổi hoặc hiệu suất phân loại trên bộ kiểm tra bên ngoài kém hoặc thấp hơn so với kết quả trên bộ kiểm tra nội bộ.Một số báo cáo chỉ ra rằng độ chính xác hoặc hiệu quả phân loại giảm khi áp dụng ước tính độ tuổi dựa trên dân số Hàn Quốc cho dân số Nhật Bản5,39 và mô hình tương tự đã được tìm thấy trong nghiên cứu hiện tại.Xu hướng suy giảm này cũng được quan sát thấy trong mô hình DM.Do đó, để ước tính chính xác độ tuổi, ngay cả khi sử dụng DM trong quá trình phân tích, các phương pháp lấy từ dữ liệu dân số bản địa, chẳng hạn như phương pháp truyền thống, nên được ưu tiên5,39,40,41,42.Vì không rõ liệu các mô hình học sâu có thể cho thấy xu hướng tương tự hay không, nên cần có các nghiên cứu so sánh độ chính xác và hiệu quả phân loại bằng các phương pháp truyền thống, mô hình DM và mô hình học sâu trên cùng một mẫu để xác nhận liệu trí tuệ nhân tạo có thể vượt qua những chênh lệch chủng tộc này ở độ tuổi hạn chế hay không.đánh giá.
Chúng tôi chứng minh rằng các phương pháp ước tính tuổi truyền thống có thể được thay thế bằng ước tính độ tuổi dựa trên mô hình DM trong thực hành ước tính tuổi pháp y ở Hàn Quốc.Chúng tôi cũng phát hiện ra khả năng triển khai công nghệ máy học để đánh giá độ tuổi pháp lý.Tuy nhiên, có những hạn chế rõ ràng, chẳng hạn như không đủ số lượng người tham gia nghiên cứu này để xác định chính xác kết quả và thiếu các nghiên cứu trước đây để so sánh và xác nhận kết quả của nghiên cứu này.Trong tương lai, các nghiên cứu về DM nên được tiến hành với số lượng mẫu lớn hơn và quần thể đa dạng hơn để nâng cao khả năng ứng dụng thực tế so với các phương pháp truyền thống.Để xác thực tính khả thi của việc sử dụng trí tuệ nhân tạo để ước tính độ tuổi ở nhiều quần thể, cần có các nghiên cứu trong tương lai để so sánh độ chính xác và hiệu quả phân loại của DM và các mô hình học sâu với các phương pháp truyền thống trong cùng một mẫu.
Nghiên cứu đã sử dụng 2.657 bức ảnh chính tả được thu thập từ người trưởng thành Hàn Quốc và Nhật Bản từ 15 đến 23 tuổi.Phim X quang Hàn Quốc được chia thành 900 bộ huấn luyện (19,42 ± 2,65 năm) và 900 bộ kiểm tra nội bộ (19,52 ± 2,59 năm).Bộ đào tạo được thu thập tại một cơ sở (Bệnh viện Seoul St. Mary) và bộ thử nghiệm riêng được thu thập tại hai cơ sở (Bệnh viện Nha khoa Đại học Quốc gia Seoul và Bệnh viện Nha khoa Đại học Yonsei).Chúng tôi cũng đã thu thập 857 ảnh chụp X quang từ một dữ liệu dựa trên dân số khác (Đại học Y khoa Iwate, Nhật Bản) để thử nghiệm bên ngoài.Phim chụp X quang của các đối tượng người Nhật (19,31 ± 2,60 tuổi) được chọn làm bộ kiểm tra bên ngoài.Dữ liệu được thu thập hồi cứu để phân tích các giai đoạn phát triển răng trên phim X quang toàn cảnh được chụp trong quá trình điều trị nha khoa.Tất cả dữ liệu được thu thập đều ẩn danh ngoại trừ giới tính, ngày sinh và ngày chụp X quang.Tiêu chí thu nhận và loại trừ giống như các nghiên cứu được công bố trước đây 4 , 5 .Tuổi thực tế của mẫu được tính bằng cách trừ ngày sinh cho ngày chụp X quang.Nhóm mẫu được chia thành chín nhóm tuổi.Sự phân bố về độ tuổi và giới tính được thể hiện trong Bảng 3. Nghiên cứu này được thực hiện theo Tuyên bố Helsinki và được phê duyệt bởi Hội đồng Đánh giá Thể chế (IRB) của Bệnh viện Seoul St. Mary thuộc Đại học Công giáo Hàn Quốc (KC22WISI0328).Do thiết kế hồi cứu của nghiên cứu này, không thể có được sự đồng ý từ tất cả các bệnh nhân được kiểm tra X quang vì mục đích điều trị.Bệnh viện St. Mary's (IRB) thuộc Đại học Seoul Hàn Quốc đã miễn yêu cầu về sự đồng ý có hiểu biết.
Các giai đoạn phát triển của răng hàm lớn thứ hai và thứ ba hai hàm được đánh giá theo tiêu chí Demircan25.Chỉ một chiếc răng được chọn nếu tìm thấy cùng loại răng ở bên trái và bên phải của mỗi hàm.Nếu các răng tương đồng ở cả hai bên ở các giai đoạn phát triển khác nhau, thì răng có giai đoạn phát triển thấp hơn được chọn để giải thích cho sự không chắc chắn về độ tuổi ước tính.Một trăm bức ảnh chụp X quang được chọn ngẫu nhiên từ tập huấn luyện đã được hai nhà quan sát có kinh nghiệm chấm điểm để kiểm tra độ tin cậy của máy chủ liên quan sau khi hiệu chuẩn trước nhằm xác định giai đoạn trưởng thành của răng.Độ tin cậy của máy chủ nội bộ được đánh giá hai lần trong khoảng thời gian ba tháng bởi người quan sát chính.
Giới tính và giai đoạn phát triển của răng hàm thứ hai và thứ ba của mỗi hàm trong tập huấn luyện được ước tính bởi một người quan sát chính được đào tạo bằng các mô hình DM khác nhau và tuổi thực tế được đặt làm giá trị mục tiêu.Các mô hình SLP và MLP, được sử dụng rộng rãi trong học máy, đã được thử nghiệm dựa trên các thuật toán hồi quy.Mô hình DM kết hợp các hàm tuyến tính sử dụng các giai đoạn phát triển của bốn chiếc răng và kết hợp những dữ liệu này để ước tính tuổi.SLP là mạng nơ-ron đơn giản nhất và không chứa các lớp ẩn.SLP hoạt động dựa trên ngưỡng truyền giữa các nút.Mô hình SLP trong hồi quy về mặt toán học tương tự như hồi quy tuyến tính bội.Không giống như mô hình SLP, mô hình MLP có nhiều lớp ẩn với các hàm kích hoạt phi tuyến.Các thử nghiệm của chúng tôi đã sử dụng một lớp ẩn chỉ có 20 nút ẩn có hàm kích hoạt phi tuyến.Sử dụng phương pháp giảm độ dốc làm phương pháp tối ưu hóa và MAE và RMSE làm hàm mất mát để huấn luyện mô hình học máy của chúng tôi.Mô hình hồi quy thu được tốt nhất đã được áp dụng cho các bộ kiểm tra bên trong và bên ngoài và ước tính tuổi của răng.
Một thuật toán phân loại đã được phát triển sử dụng độ trưởng thành của bốn răng trên tập huấn luyện để dự đoán liệu mẫu có đủ 18 tuổi hay không.Để xây dựng mô hình, chúng tôi đã rút ra bảy thuật toán học máy biểu diễn6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost và (7) MLP .LR là một trong những thuật toán phân loại được sử dụng rộng rãi nhất44.Đây là một thuật toán học có giám sát sử dụng hồi quy để dự đoán xác suất dữ liệu thuộc một danh mục nhất định từ 0 đến 1 và phân loại dữ liệu thuộc danh mục có nhiều khả năng hơn dựa trên xác suất này;chủ yếu được sử dụng để phân loại nhị phân.KNN là một trong những thuật toán học máy đơn giản nhất45.Khi được cung cấp dữ liệu đầu vào mới, nó sẽ tìm k dữ liệu gần với tập hợp hiện có và sau đó phân loại chúng vào lớp có tần suất cao nhất.Chúng tôi đặt 3 cho số lượng hàng xóm được xem xét (k).SVM là một thuật toán tối đa hóa khoảng cách giữa hai lớp bằng cách sử dụng hàm kernel để mở rộng không gian tuyến tính thành không gian phi tuyến tính gọi là trường46.Đối với mô hình này, chúng tôi sử dụng độ lệch = 1, sức mạnh = 1 và gamma = 1 làm siêu tham số cho hạt nhân đa thức.DT đã được áp dụng trong nhiều lĩnh vực khác nhau như một thuật toán để chia toàn bộ tập dữ liệu thành nhiều nhóm con bằng cách biểu diễn các quy tắc quyết định trong cấu trúc cây47.Mô hình được định cấu hình với số lượng bản ghi tối thiểu trên mỗi nút là 2 và sử dụng chỉ số Gini làm thước đo chất lượng.RF là một phương pháp tổng hợp kết hợp nhiều DT để cải thiện hiệu suất bằng phương pháp tổng hợp bootstrap nhằm tạo ra bộ phân loại yếu cho từng mẫu bằng cách lấy ngẫu nhiên các mẫu có cùng kích thước nhiều lần từ tập dữ liệu gốc48.Chúng tôi đã sử dụng 100 cây, 10 độ sâu của cây, 1 kích thước nút tối thiểu và chỉ số phụ gia Gini làm tiêu chí phân tách nút.Việc phân loại dữ liệu mới được xác định bằng đa số phiếu.XGBoost là một thuật toán kết hợp các kỹ thuật tăng cường bằng phương pháp lấy lỗi dữ liệu huấn luyện giữa giá trị thực tế và dự đoán của mô hình trước đó và tăng lỗi bằng cách sử dụng gradient49.Đây là một thuật toán được sử dụng rộng rãi do hiệu suất tốt và hiệu quả tài nguyên, cũng như độ tin cậy cao như một chức năng hiệu chỉnh quá mức.Mẫu xe được trang bị 400 bánh xe hỗ trợ.MLP là một mạng lưới thần kinh trong đó một hoặc nhiều perceptron tạo thành nhiều lớp với một hoặc nhiều lớp ẩn giữa lớp đầu vào và lớp đầu ra38.Bằng cách sử dụng tính năng này, bạn có thể thực hiện phân loại phi tuyến tính khi bạn thêm lớp đầu vào và nhận giá trị kết quả, giá trị kết quả dự đoán sẽ được so sánh với giá trị kết quả thực tế và lỗi sẽ được truyền ngược lại.Chúng tôi đã tạo một lớp ẩn với 20 nơ-ron ẩn trong mỗi lớp.Mỗi mô hình chúng tôi phát triển đều được áp dụng cho các bộ bên trong và bên ngoài để kiểm tra hiệu suất phân loại bằng cách tính toán độ nhạy, độ đặc hiệu, PPV, NPV và AUROC.Độ nhạy được định nghĩa là tỷ lệ giữa mẫu ước tính từ 18 tuổi trở lên với mẫu ước tính từ 18 tuổi trở lên.Độ đặc hiệu là tỷ lệ mẫu dưới 18 tuổi và mẫu ước tính dưới 18 tuổi.
Các giai đoạn nha khoa được đánh giá trong tập huấn luyện đã được chuyển đổi thành các giai đoạn số để phân tích thống kê.Hồi quy tuyến tính và logistic đa biến được thực hiện để phát triển các mô hình dự đoán cho từng giới tính và rút ra các công thức hồi quy có thể được sử dụng để ước tính độ tuổi.Chúng tôi đã sử dụng những công thức này để ước tính tuổi răng cho cả bộ kiểm tra bên trong và bên ngoài.Bảng 4 cho thấy các mô hình hồi quy và phân loại được sử dụng trong nghiên cứu này.
Độ tin cậy trong máy chủ và giữa các máy chủ được tính toán bằng thống kê kappa của Cohen.Để kiểm tra độ chính xác của DM và các mô hình hồi quy truyền thống, chúng tôi đã tính toán MAE và RMSE bằng cách sử dụng độ tuổi ước tính và thực tế của các bộ kiểm tra bên trong và bên ngoài.Những lỗi này thường được sử dụng để đánh giá tính chính xác của dự đoán mô hình.Sai số càng nhỏ thì độ chính xác của dự báo càng cao24.So sánh MAE và RMSE của các bộ thử nghiệm bên trong và bên ngoài được tính toán bằng DM và hồi quy truyền thống.Hiệu suất phân loại của ngưỡng 18 năm trong thống kê truyền thống được đánh giá bằng bảng dự phòng 2 × 2.Độ nhạy, độ đặc hiệu, PPV, NPV và AUROC được tính toán của bộ thử nghiệm được so sánh với các giá trị đo được của mô hình phân loại DM.Dữ liệu được biểu thị dưới dạng trung bình ± độ lệch chuẩn hoặc số (%) tùy thuộc vào đặc điểm dữ liệu.Giá trị P hai mặt <0,05 được coi là có ý nghĩa thống kê.Tất cả các phân tích thống kê thông thường được thực hiện bằng SAS phiên bản 9.4 (SAS Institute, Cary, NC).Mô hình hồi quy DM được triển khai bằng Python sử dụng phần phụ trợ Keras50 2.2.4 và Tensorflow51 1.8.0 dành riêng cho các phép toán.Mô hình phân loại DM được triển khai trong Môi trường phân tích kiến thức Waikato và nền tảng phân tích Konstanz Information Miner (KNIME) 4.6.152.
Các tác giả thừa nhận rằng dữ liệu hỗ trợ kết luận của nghiên cứu có thể được tìm thấy trong bài báo và tài liệu bổ sung.Các bộ dữ liệu được tạo và/hoặc phân tích trong quá trình nghiên cứu được tác giả tương ứng cung cấp theo yêu cầu hợp lý.
Ritz-Timme, S. và cộng sự.Đánh giá độ tuổi: hiện đại để đáp ứng các yêu cầu cụ thể của thực hành pháp y.tính quốc tế.J. Y học pháp lý.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., và Olze, A. Hiện trạng đánh giá độ tuổi pháp y của các đối tượng sống cho mục đích truy tố hình sự.Pháp y.thuốc.Bệnh lý học.1, 239–246 (2005).
Pan, J. và cộng sự.Một phương pháp sửa đổi để đánh giá tuổi răng của trẻ em từ 5 đến 16 tuổi ở miền đông Trung Quốc.lâm sàng.Khảo sát miệng.25, 3463–3474 (2021).
Lee, SS, v.v. Niên đại về sự phát triển của răng hàm thứ hai và thứ ba ở người Hàn Quốc và ứng dụng của nó để đánh giá độ tuổi pháp y.tính quốc tế.J. Y học pháp lý.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY và Lee, SS Độ chính xác của ước lượng tuổi và ước tính ngưỡng 18 tuổi dựa trên độ trưởng thành của răng hàm thứ hai và thứ ba ở người Hàn Quốc và Nhật Bản.XIN VUI LÒNG MỘT 17, e0271247 (2022).
Kim, JY và cộng sự.Phân tích dữ liệu dựa trên học máy trước phẫu thuật có thể dự đoán kết quả điều trị phẫu thuật giấc ngủ ở bệnh nhân OSA.khoa học.Báo cáo 11, 14911 (2021).
Han, M. và cộng sự.Ước tính độ tuổi chính xác từ học máy có hoặc không có sự can thiệp của con người?tính quốc tế.J. Y học pháp lý.136, 821–831 (2022).
Khan, S. và Shaheen, M. Từ khai thác dữ liệu đến khai thác dữ liệu.J.Thông tin.khoa học.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. và Shaheen, M. WisRule: Thuật toán nhận thức đầu tiên để khai thác quy tắc kết hợp.J.Thông tin.khoa học.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. và Abdullah U. Karm: Khai thác dữ liệu truyền thống dựa trên các quy tắc kết hợp dựa trên ngữ cảnh.tính toán.Matt.Tiếp tục.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. và Habib M. Phát hiện sự tương đồng về ngữ nghĩa dựa trên học sâu bằng cách sử dụng dữ liệu văn bản.thông báo.công nghệ.điều khiển.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. và Shahin, M. Một hệ thống nhận dạng hoạt động trong video thể thao.đa phương tiện.Công cụ Ứng dụng https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS và cộng sự.Thử thách học máy RSNA ở tuổi xương trẻ em.X quang 290, 498–503 (2019).
Li, Y. và cộng sự.Ước tính tuổi pháp y từ chụp X-quang vùng chậu bằng cách sử dụng học sâu.EURO.sự bức xạ.29, 2322–2329 (2019).
Quách, YC, và cộng sự.Phân loại độ tuổi chính xác bằng phương pháp thủ công và mạng lưới thần kinh tích chập sâu từ hình ảnh chiếu chính tả.tính quốc tế.J. Y học pháp lý.135, 1589–1597 (2021).
Alabama Dalora và cộng sự.Ước tính tuổi xương bằng các phương pháp học máy khác nhau: tổng quan tài liệu có hệ thống và phân tích tổng hợp.XIN VUI LÒNG MỘT 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. và Yang, J. Ước tính độ tuổi cụ thể theo dân số của người Mỹ gốc Phi và người Trung Quốc dựa trên thể tích buồng tủy của răng hàm đầu tiên sử dụng phương pháp chụp cắt lớp vi tính chùm tia hình nón.tính quốc tế.J. Y học pháp lý.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK và Oh KS Xác định nhóm tuổi của người đang sống bằng hình ảnh răng hàm đầu tiên dựa trên trí tuệ nhân tạo.khoa học.Báo cáo 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. và Urschler, M. Ước tính độ tuổi tự động và phân loại độ tuổi đa số từ dữ liệu MRI đa biến.IEEE J. Biomed.Cảnh báo sức khỏe.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. và Li, G. Ước tính tuổi dựa trên phân đoạn buồng tủy 3D của răng hàm đầu tiên từ chụp cắt lớp vi tính chùm tia hình nón bằng cách tích hợp các bộ cấp độ và học sâu.tính quốc tế.J. Y học pháp lý.135, 365–373 (2021).
Wu, WT và cộng sự.Khai thác dữ liệu trong dữ liệu lớn lâm sàng: cơ sở dữ liệu chung, các bước và mô hình phương pháp.Thế giới.thuốc.nguồn.8, 44 (2021).
Yang, J. và cộng sự.Giới thiệu về Cơ sở dữ liệu y tế và Công nghệ khai thác dữ liệu trong Kỷ nguyên dữ liệu lớn.J. Avid.Y học cơ bản.13, 57–69 (2020).
Shen, S. và cộng sự.Phương pháp ước tính tuổi răng của Camerer bằng máy học.BMC Sức khỏe răng miệng 21, 641 (2021).
Galliburg A. và cộng sự.So sánh các phương pháp học máy khác nhau để dự đoán tuổi răng bằng phương pháp phân giai đoạn Demirdjian.tính quốc tế.J. Y học pháp lý.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. và Tanner, JM Một hệ thống mới để đánh giá tuổi răng.khịt mũi.sinh vật học.45, 211–227 (1973).
Landis, JR và Koch, GG Các thước đo về sự đồng thuận của người quan sát đối với dữ liệu phân loại.Sinh trắc học 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK và Choi HK.Phân tích kết cấu, hình thái và thống kê của hình ảnh cộng hưởng từ hai chiều bằng kỹ thuật trí tuệ nhân tạo để phân biệt các khối u não nguyên phát.Thông tin sức khỏe.nguồn.https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Thời gian đăng: Jan-04-2024

Xác thực mô hình khai thác dữ liệu dựa trên các phương pháp ước tính tuổi răng truyền thống của thanh thiếu niên và thanh niên Hàn Quốc