Спасибо за посещение Nature.com. Версия браузера, которую вы используете, имеет ограниченную поддержку CSS. Для достижения наилучших результатов мы рекомендуем использовать более новую версию вашего браузера (или отключить режим совместимости в Internet Explorer). В то же время, чтобы обеспечить постоянную поддержку, мы показываем сайт без стиля или JavaScript.
Зубы считаются наиболее точным показателем возраста человеческого тела и часто используются в оценке судебного возраста. Мы стремились проверить оценки стоматологического возраста на основе данных, сравнивая точность оценки и эффективность классификации 18-летнего порога с традиционными методами и оценками возраста на основе данных. В общей сложности 2657 панорамных рентгенограмм были собраны у корейских и японских граждан в возрасте от 15 до 23 лет. Они были разделены на тренировочный набор, каждый из которых содержал 900 корейских рентгенограмм, и внутренний тестовый набор, содержащий 857 японских рентгенограмм. Мы сравнили точность классификации и эффективность традиционных методов с тестовыми наборами моделей интеллектуального анализа данных. Точность традиционного метода во внутреннем наборе тестирования немного выше, чем у модели интеллектуального анализа данных, и разница невелика (средняя абсолютная ошибка <0,21 года, средняя квадратная ошибка <0,24 года). Производительность классификации для 18-летнего отсечения также аналогична традиционным методам и моделям интеллектуального анализа данных. Таким образом, традиционные методы могут быть заменены моделями интеллектуального анализа данных при выполнении оценки криминалистического возраста с использованием зрелости второго и третьего моляров у корейских подростков и молодых людей.
Оценка стоматологического возраста широко используется в судебной медицине и детской стоматологии. В частности, из -за высокой корреляции между хронологическим возрастом и развитием зубов оценка возраста по этапам развития зубов является важным критерием для оценки возраста детей и подростков1,2,3. Однако для молодежи оценка стоматологического возраста, основанного на зрелости зубов, имеет свои ограничения, поскольку рост зубов почти завершен, за исключением третьих моляров. Юридическая цель определения возраста молодых людей и подростков состоит в том, чтобы предоставить точные оценки и научные доказательства того, достигли ли они возраста большинства. В медицинской легальной практике подростков и молодых людей в Корее возраст был оценен с использованием метода Ли, и был предсказан правовой порог 18 лет на основе данных, представленных OH et al 5.
Машинное обучение - это тип искусственного интеллекта (ИИ), который неоднократно изучает и классифицирует большие объемы данных, решает проблемы самостоятельно и управляет программированием данных. Машинное обучение может обнаружить полезные скрытые закономерности в больших объемах данных6. Напротив, классические методы, которые имеют трудоемкий и трудоемкий, могут иметь ограничения при работе с большими объемами сложных данных, которые трудно обработать вручную7. Таким образом, в последнее время было проведено много исследований с использованием новейших компьютерных технологий для минимизации человеческих ошибок и эффективной обработки многомерных данных8,9,10,11,12. В частности, глубокое обучение широко использовалось в анализе медицинского изображения, и, как сообщалось, различные методы оценки возраста путем автоматического анализа рентгенограмм повышают точность и эффективность оценки возраста13,14,15,16,17,18,202020. Полем Например, Halabi et al. 13 разработали алгоритм машинного обучения, основанное на сверточных нейронных сетях (CNN), чтобы оценить скелетный возраст с использованием рентгенограмм рук детей. В этом исследовании предлагается модель, которая применяет машинное обучение к медицинским изображениям и показывает, что эти методы могут повысить точность диагностики. Li et al. Оценка возраста от рентгеновских изображений таза с использованием CNN глубокого обучения и сравнила их с результатами регрессии с использованием оценки стадии усиления. Они обнаружили, что модель CNN глубокого обучения показала такую же показатели оценки возраста, что и традиционная регрессионная модель. Исследование Guo et al. [15] оценило эффективность классификации толерантности к возрасту технологии CNN, основанную на зубных ортофотосах, и результаты модели CNN доказали, что люди превзошли его эффективность классификации возрастной классификации.
Большинство исследований по оценке возраста с использованием машинного обучения используют методы глубокого обучения13,14,15,16,17,18,19,20. Сообщается, что оценка возраста, основанная на глубоком обучении, является более точной, чем традиционные методы. Тем не менее, этот подход дает мало возможностей представить научную основу для возрастных оценок, таких как возрастные показатели, используемые в оценках. Существует также юридический спор о том, кто проводит инспекции. Поэтому возрастная оценка, основанная на глубоком обучении, трудно принять административными и судебными органами. Maning Data (DM) - это метод, который может обнаружить не только ожидаемую, но и неожиданную информацию как метод для обнаружения полезных корреляций между большими объемами данных 6,21,22. Машиное обучение часто используется в добыче данных, и как интеллектуальный анализ данных, так и машинное обучение используют одни и те же ключевые алгоритмы для обнаружения шаблонов в данных. Оценка возраста с использованием зубного развития основана на оценке зрелости целевых зубов эксперта, и эта оценка выражается в качестве стадии для каждого целевого зуба. DM может быть использован для анализа корреляции между этапом стоматологической оценки и фактическим возрастом и может заменить традиционный статистический анализ. Поэтому, если мы применяем методы DM к оценке возраста, мы можем реализовать машинное обучение в оценке судебного возраста, не беспокоясь о юридической ответственности. Несколько сравнительных исследований были опубликованы по возможным альтернативам традиционным ручным методам, используемым в судебной практике, и методам на основе EBM для определения возраста зубов. Shen et al23 показали, что модель DM более точная, чем традиционная формула Camerer. Galibourg и соавторы 24 применяли различные методы DM для прогнозирования возраста в соответствии с Criterion25 Demirdjian, и результаты показали, что метод DM превзошел методы Demirdjian и Willems в оценке возраста французского населения.
Чтобы оценить стоматологический век корейских подростков и молодых людей, метод 4 Ли широко используется в корейской судебной практике. В этом методе используется традиционный статистический анализ (такой как множественная регрессия) для изучения взаимосвязи между корейскими субъектами и хронологическим возрастом. В этом исследовании методы оценки возраста, полученные с использованием традиционных статистических методов, определяются как «традиционные методы». Метод Ли является традиционным методом, и его точность была подтверждена OH et al. 5; Тем не менее, применимость оценки возраста, основанная на модели DM в корейской судебной практике, все еще сомнительна. Наша цель состояла в том, чтобы научно подтвердить потенциальную полезность оценки возраста, основанную на модели DM. Целью данного исследования было (1) сравнить точность двух моделей DM в оценке стоматологического возраста и (2) для сравнения эффективности классификации 7 моделей DM в возрасте 18 лет с полученными с использованием традиционных статистических методов зрелости второго и третьи моляры в обеих челюстях.
Средства и стандартные отклонения хронологического возраста по стадии и типу зубов показаны онлайн в дополнительной таблице S1 (учебный набор), дополнительной таблице S2 (внутренний набор тестов) и дополнительную таблицу S3 (внешний тестовый набор). Значения каппа для надежности внутри- и межзерверов, полученных из учебного набора, составили 0,951 и 0,947 соответственно. Значения P и 95% доверительные интервалы для значений Kappa показаны в дополнительной онлайн -таблице S4. Значение каппа была интерпретирована как «почти совершенная», что согласуется с критериями Landis и Koch26.
При сравнении средней абсолютной ошибки (MAE) традиционный метод слегка превосходит модель DM для всех полов и во внешнем мужском испытательном наборе, за исключением Multilayer Perceptron (MLP). Разница между традиционной моделью и моделью DM на внутреннем испытательном наборе MAE составила 0,12–0,19 года для мужчин и 0,17–0,21 года для женщин. Для внешней испытательной батареи различия меньше (0,001–0,05 лет для мужчин и 0,05–0,09 лет для женщин). Кроме того, средняя квадратная ошибка (RMSE) немного ниже, чем традиционный метод, с меньшими различиями (0,17–0,24, 0,2–0,24 для мужского внутреннего испытательного набора и 0,03–0,07, 0,04–0,08 для набора внешнего теста). ) MLP показывает немного лучшую производительность, чем один слой Perceptron (SLP), за исключением случая женского внешнего теста. Для MAE и RMSE внешний тестовый набор оценивается выше, чем внутренний набор тестов для всех полов и моделей. Все MAE и RMSE показаны в таблице 1 и на рисунке 1.
MAE и RMSE традиционных моделей регрессии данных. Средняя абсолютная ошибка MAE, средняя квадратная ошибка RMSE, однослойный SLP SLP, многослойный персептронный MLP, традиционный метод CM.
Производительность классификации (с отсечкой 18 лет) традиционных моделей и DM была продемонстрирована с точки зрения чувствительности, специфичности, положительной прогнозной ценности (PPV), отрицательной прогнозной ценности (NPV) и площади под кривой рабочей характеристики приемника (AuroC) 27 (Таблица 2, Рисунок 2 и Дополнительный Рисунок 1 онлайн). С точки зрения чувствительности внутренней тестовой батареи традиционные методы выполнялись лучше всего среди мужчин и хуже среди женщин. Тем не менее, разница в эффективности классификации между традиционными методами и SD составляет 9,7% для мужчин (MLP) и только 2,4% для женщин (XGBOOST). Среди моделей DM логистическая регрессия (LR) показала лучшую чувствительность у обоих полов. Что касается специфичности внутреннего испытательного набора, было отмечено, что четыре модели SD работали хорошо у мужчин, в то время как традиционная модель работала лучше у женщин. Различия в эффективности классификации для мужчин и женщин составляют 13,3% (MLP) и 13,1% (MLP), соответственно, что указывает на то, что разница в производительности классификации между моделями превышает чувствительность. Среди моделей DM модели моделей поддержки векторного вектора (SVM), дерева решений (DT) и случайных лесов (RF) выполнялись лучше всего среди мужчин, в то время как модель LR выполнялась лучше всего среди женщин. Auroc традиционной модели и всех моделей SD были более 0,925 (K-ближайший сосед (KNN) у мужчин), демонстрируя превосходные результаты классификации в дискриминационных 18-летних образцах28. Для внешнего испытательного набора наблюдалось снижение производительности классификации с точки зрения чувствительности, специфичности и AUROC по сравнению с внутренним набором тестов. Более того, разница в чувствительности и специфичности между эффективностью классификации лучших и худших моделей варьировалась от 10% до 25% и была больше, чем разница во внутреннем наборе тестов.
Чувствительность и специфичность моделей классификации данных по сравнению с традиционными методами с отсечкой 18 лет. Knn K ближайший сосед, SVM поддержка Vector Machine, LR Logistic Regression, Дерево решений DT, RF Random Forest, XGB XGBOOST, MLP Multilayer Perceptron, традиционный метод CM.
Первым шагом в этом исследовании было сравнение точности оценок стоматологического возраста, полученных из семи моделей DM, с полученными с использованием традиционной регрессии. MAE и RMSE были оценены во внутренних наборах тестирования для обоих полов, а разница между традиционным методом и моделью DM варьировалась от 44 до 77 дней для MAE и от 62 до 88 дней для RMSE. Хотя традиционный метод был немного более точным в этом исследовании, трудно сделать вывод, имеет ли такое небольшое различие клиническое или практическое значение. Эти результаты показывают, что точность оценки века стоматологического возраста с использованием модели DM почти такая же, как и у традиционного метода. Прямое сравнение с результатами предыдущих исследований сложно, потому что ни одно исследование не сравнивало точность моделей DM с традиционными статистическими методами, используя ту же метод регистрации зубов в том же возрастном диапазоне, что и в этом исследовании. Galibourg и др. 24 сравнили MAE и RMSE между двумя традиционными методами (Demirjian Method25 и Willems Method29) и 10 моделями DM в французском населении в возрасте от 2 до 24 лет. Они сообщили, что все модели DM были более точными, чем традиционные методы, с различиями в 0,20 и 0,38 года в MAE и 0,25 и 0,47 годах в RMSE по сравнению с методами Виллема и Демирджян, соответственно. Расхождение между моделью SD и традиционными методами, показанными в исследовании Halibourg, учитывает многочисленные отчеты 30,31,32,33 о том, что метод Демирджян не точно оценивает возраст стоматологии в популяциях, отличных от французских канадцев, на которых основывалось исследование. В этом исследовании. Тай и др. 34 использовали алгоритм MLP для прогнозирования возраста зубов с 1636 китайских ортодонтических фотографий и сравнил его точность с результатами метода Демирджян и Виллема. Они сообщили, что MLP имеет более высокую точность, чем традиционные методы. Разница между методом Демирджяна и традиционным методом составляет <0,32 года, а метод Виллемса составляет 0,28 года, что аналогично результатам настоящего исследования. Результаты этих предыдущих исследований24,34 также согласуются с результатами настоящего исследования, а точность оценки возрастной оценки модели DM и традиционного метода аналогична. Однако, основываясь на представленных результатах, мы можем только осторожно прийти к выводу, что использование моделей DM для оценки возраста может заменить существующие методы из -за отсутствия сравнительных и ссыльных предыдущих исследований. Последующие исследования с использованием более крупных образцов необходимы для подтверждения результатов, полученных в этом исследовании.
Среди исследований, проверяющих точность SD в оценке века зубов, некоторые показали более высокую точность, чем наше исследование. Степановский и др. 35 применили 22 модели SD к панорамным рентгенограммам 976 жителей чешских препаратов в возрасте от 2,7 до 20,5 лет и проверили точность каждой модели. Они оценили разработку в общей сложности 16 верхних и нижних левых зубов, используя критерии классификации, предложенные Moorrees et al 36. MAE колеблется от 0,64 до 0,94 года, а RMSE колеблется от 0,85 до 1,27 года, которые более точны, чем две модели DM, используемые в этом исследовании. Shen et al. 23 использовали метод Cameriere для оценки стоматологического возраста семи постоянных зубов в левой нижней челюсти у жителей восточных китайцев в возрасте от 5 до 13 лет и сравнили его с возрастами, оцененными с использованием линейной регрессии, SVM и RF. Они показали, что все три модели DM имеют более высокую точность по сравнению с традиционной формулой Cameriere. MAE и RMSE в исследовании Шена были ниже, чем в модели DM в этом исследовании. Повышенная точность исследований Степановски и соавт. 35 и Shen et al. 23 может быть связано с включением молодых субъектов в их исследовательские образцы. Поскольку возрастные оценки для участников с развивающимися зубами становятся более точными по мере увеличения количества зубов во время развития зубов, точность полученного метода оценки возраста может быть скомпрометирована, когда участники исследования моложе. Кроме того, ошибка MLP в оценке возраста немного меньше, чем SLP, что означает, что MLP более точен, чем SLP. MLP считается немного лучше для оценки возраста, возможно, из -за скрытых слоев в MLP38. Тем не менее, существует исключение для внешней выборки женщин (SLP 1.45, MLP 1.49). Обнаружение того, что MLP является более точным, чем SLP при оценке возраста, требует дополнительных ретроспективных исследований.
Были также сравнивались характеристики классификации модели DM и традиционного метода на 18-летнем пороге. Все протестированные модели SD и традиционные методы во внутреннем наборе тестов показали практически приемлемые уровни дискриминации для 18-летней выборки. Чувствительность для мужчин и женщин превышала 87,7% и 94,9% соответственно, а специфичность превышала 89,3% и 84,7%. Auroc всех протестированных моделей также превышает 0,925. Насколько нам известно, ни одно исследование не проверило эффективность модели DM для 18-летней классификации на основе зрелости зубов. Мы можем сравнить результаты этого исследования с эффективностью классификации моделей глубокого обучения на панорамных рентгенограммах. Guo et al.15 вычислили эффективность классификации модели глубокого обучения на основе CNN и ручного метода, основанного на методе Демирджа для определенного возрастного порога. Чувствительность и специфичность ручного метода составляли 87,7% и 95,5% соответственно, а чувствительность и специфичность модели CNN превышали 89,2% и 86,6% соответственно. Они пришли к выводу, что модели глубокого обучения могут заменить или превзойти ручную оценку в классификации возрастных порогов. Результаты этого исследования показали аналогичные результаты классификации; Считается, что классификация с использованием моделей DM может заменить традиционные статистические методы оценки возраста. Среди моделей DM LR был лучшей моделью с точки зрения чувствительности для мужской выборки и чувствительности и специфичности для женской выборки. LR занимает второе место по специфичности для мужчин. Более того, LR считается одной из наиболее удобных моделей DM35 и является менее сложной и сложной для обработки. Основываясь на этих результатах, LR считалась лучшей моделью классификации для 18-летних детей в корейском населении.
В целом, точность оценки возраста или эффективность классификации на внешнем тесте была плохой или ниже по сравнению с результатами внутреннего набора тестов. В некоторых отчетах указывается, что точность или эффективность классификации снижается, когда возрастные оценки, основанные на корейской популяции, применяются к японскому населению 5,39, а в настоящем исследовании была обнаружена аналогичная модель. Эта тенденция ухудшения также наблюдалась в модели DM. Следовательно, для точной оценки возраста, даже при использовании DM в процессе анализа, методы, полученные из данных нативного населения, таких как традиционные методы, должны быть предпочтительными5,39,40,41,42. Поскольку неясно, могут ли модели глубокого обучения показывать аналогичные тенденции, исследования, сравнивающие точность и эффективность классификации с использованием традиционных методов, моделей DM и моделей глубокого обучения на одних и тех же образцах, чтобы подтвердить, может ли искусственный интеллект преодолеть эти расовые различия в ограниченном возрасте. Оценки.
Мы демонстрируем, что традиционные методы могут быть заменены оценкой возраста на основе модели DM в практике оценки криминалистического возраста в Корее. Мы также обнаружили возможность реализации машинного обучения для оценки судебно -медицинского возраста. Тем не менее, существуют четкие ограничения, такие как недостаточное количество участников в этом исследовании, чтобы окончательно определить результаты, и отсутствие предыдущих исследований для сравнения и подтверждения результатов этого исследования. В будущем необходимо провести исследования DM с большим количеством образцов и более разнообразных популяций, чтобы улучшить ее практическую применимость по сравнению с традиционными методами. Чтобы подтвердить выполнимость использования искусственного интеллекта для оценки возраста во многих популяциях, необходимы будущие исследования для сравнения точности классификации и эффективности DM и моделей глубокого обучения с традиционными методами в одних и тех же выборках.
В исследовании было использовано 2657 орфографических фотографий, собранных у корейских и японских взрослых в возрасте от 15 до 23 лет. Корейские рентгенограммы были разделены на 900 учебных наборов (19,42 ± 2,65 года) и 900 внутренних испытательных наборов (19,52 ± 2,59 года). Учебный набор был собран в одном учреждении (больница Сент -Мэри Сеуль), а собственный тестовый набор был собран в двух учреждениях (стоматологическая больница Сеульского университета и стоматологическая больница Университета Йонсей). Мы также собрали 857 рентгенограмм из других популяционных данных (Iwate Medical University, Япония) для внешнего тестирования. В качестве внешнего испытательного набора были выбраны рентгенограммы японских субъектов (19,31 ± 2,60 года). Данные были собраны ретроспективно для анализа стадий развития зубов на панорамных рентгенограммах, взятых во время лечения зубов. Все собранные данные были анонимными, за исключением пола, даты рождения и даты рентгенограммы. Критерии включения и исключения были такими же, как и ранее опубликованные исследования 4, 5. Фактический возраст выборки был рассчитан путем вычитания даты рождения с даты, когда была взята рентгенограмма. Группа выборки была разделена на девять возрастных групп. Распределения по возрасту и полу приведены в Таблице 3 Это исследование было проведено в соответствии с Декларацией Хельсинки и одобрено Институциональным контрольным советом (IRB) больницы Святой Марии в Католическом университете Кореи (KC22WISI0328). Из -за ретроспективного дизайна этого исследования, информированное согласие не может быть получено от всех пациентов, проходящих рентгенографическое обследование в терапевтических целях. Университет Сеульского университета Св. Марии (IRB) отказалась от требования к информированному согласию.
Стадии развития бимаксиллярных второго и третьего моляров были оценены в соответствии с критериями Demircan25. Только один зуб был выбран, если один и тот же тип зуба был обнаружен на левой и правой сторонах каждой челюсти. Если гомологичные зубы с обеих сторон находились на разных стадиях развития, зуб с более низкой стадией развития был выбран для учета неопределенности в предполагаемом возрасте. Сто случайно выбранные рентгенограммы из обучающего набора были оценены двумя опытными наблюдателями для проверки надежности между наблюдателями после предварительной алибровки для определения стадии зрелости зубов. Внутренняя надежность оценивалась дважды с трехмесячным интервалом первичным наблюдателем.
Стадия пола и развития второго и третьего моляров каждой челюсти в учебном наборе оценивались первичным наблюдателем, обученным с различными моделями DM, и фактический возраст был установлен в качестве целевого значения. Модели SLP и MLP, которые широко используются в машинном обучении, были протестированы на алгоритмах регрессии. Модель DM объединяет линейные функции с использованием стадий развития четырех зубов и объединяет эти данные для оценки возраста. SLP является самой простой нейронной сетью и не содержит скрытых слоев. SLP работает на основе пороговой передачи между узлами. Модель SLP в регрессии математически аналогична множественной линейной регрессии. В отличие от модели SLP, модель MLP имеет несколько скрытых слоев с нелинейными функциями активации. В наших экспериментах использовался скрытый слой только с 20 скрытыми узлами с нелинейными функциями активации. Используйте градиент спуск в качестве метода оптимизации, а MAE и RMSE в качестве функции потерь для обучения нашей модели машинного обучения. Лучшая полученная регрессионная модель была применена к внутренним и внешним тестовым наборам, и был оценен возраст зубов.
Был разработан алгоритм классификации, который использует зрелость четырех зубов на тренировочном наборе, чтобы предсказать, является ли образец 18 лет или нет. Чтобы построить модель, мы получили семь алгоритмов машинного обучения. Полем LR является одним из наиболее широко используемых алгоритмов классификации44. Это контролируемый алгоритм обучения, который использует регрессию для прогнозирования вероятности данных, принадлежащих к определенной категории от 0 до 1, и классифицирует данные как принадлежащие к более вероятной категории, основанной на этой вероятности; в основном используется для бинарной классификации. KNN является одним из самых простых алгоритмов машинного обучения45. Когда даны новые входные данные, он находит K данных, близкие к существующему набору, а затем классифицирует их в классе с самой высокой частотой. Мы установили 3 для количества рассмотренных соседей (k). SVM-это алгоритм, который максимизирует расстояние между двумя классами, используя функцию ядра для расширения линейного пространства в нелинейное пространство, называемое Fields46. Для этой модели мы используем Bias = 1, Power = 1 и Gamma = 1 в качестве гиперпараметров для полиномиального ядра. DT был применен в различных областях в качестве алгоритма для разделения целых данных на несколько подгрупп, представляя правила принятия решений в структуре дерева47. Модель настроена с минимальным количеством записей на узел 2 и использует индекс GINI в качестве меры качества. RF - это метод ансамбля, который объединяет несколько DTS для повышения производительности с использованием метода агрегации начальной загрузки, который генерирует слабый классификатор для каждого образца путем случайного рисования образцов одного и того же размера несколько раз из исходного набора данных48. Мы использовали 100 деревьев, 10 глубин деревьев, 1 минимальный размер узла и индекс примесей Джини в качестве критериев разделения узлов. Классификация новых данных определяется большинством голосов. XGBOOST - это алгоритм, который сочетает в себе методы повышения с использованием метода, который принимает в качестве обучающих данных ошибку между фактическими и прогнозируемыми значениями предыдущей модели и увеличивает ошибку с использованием Gradients49. Это широко используемый алгоритм из -за его хорошей производительности и эффективности ресурсов, а также высокой надежности в качестве функции переосмысления. Модель оснащена 400 опорными колесами. MLP - это нейронная сеть, в которой один или несколько персептронов образуют несколько слоев с одним или несколькими скрытыми слоями между входными и выходными уровнями38. Используя это, вы можете выполнить нелинейную классификацию, когда при добавлении входного уровня и получить значение результата, прогнозируемое значение результата сравнивается с фактическим значением результата, а ошибка распространяется назад. Мы создали скрытый слой с 20 скрытыми нейронами в каждом слое. Каждая модель, которую мы разработали, была применена к внутренним и внешним наборам для проверки производительности классификации путем расчета чувствительности, специфичности, PPV, NPV и AUROC. Чувствительность определяется как отношение выборки, оцениваемое в возрасте 18 лет и старше к выборке, оцениваемой в возрасте 18 лет и старше. Специфичность - это доля образцов в возрасте до 18 лет, а те, которые оцениваются в возрасте до 18 лет.
Стоматологические этапы, оцененные в учебном наборе, были преобразованы в числовые этапы для статистического анализа. Многофакторная линейная и логистическая регрессия была выполнена для разработки прогнозирующих моделей для каждого пола и вывода формул регрессии, которые можно использовать для оценки возраста. Мы использовали эти формулы для оценки возраста зубов как для внутренних, так и для внешних испытательных наборов. В таблице 4 показаны модели регрессии и классификации, используемые в этом исследовании.
Надежность внутри- и межветателей была рассчитана с использованием статистики Каппа Коэна. Чтобы проверить точность DM и традиционных регрессионных моделей, мы рассчитали MAE и RMSE, используя расчетный и фактический возраст внутренних и внешних испытательных наборов. Эти ошибки обычно используются для оценки точности модельных прогнозов. Чем меньше ошибка, тем выше точность прогноза24. Сравните MAE и RMSE внутренних и внешних испытательных наборов, рассчитанных с использованием DM и традиционной регрессии. Классификационная эффективность 18-летнего отсечения в традиционной статистике была оценена с использованием 2 × 2 таблицы непредвиденных обстоятельств. Рассчитанная чувствительность, специфичность, PPV, NPV и AUROC набора тестов сравнивались с измеренными значениями модели классификации DM. Данные выражаются как среднее ± стандартное отклонение или число (%) в зависимости от характеристик данных. Двусторонние значения P <0,05 считались статистически значимыми. Все обычные статистические анализы были выполнены с использованием версии 9.4 SAS (SAS Institute, Cary, NC). Модель регрессии DM была реализована в Python с использованием Backend Keras50 2.2.4 и TensorFlow51 1.8.0 специально для математических операций. Модель классификации DM была реализована в среде анализа знаний Waikato и информационной платформе Konstanz Information Miner (Knime) 4.6.152.
Авторы признают, что данные, подтверждающие выводы исследования, можно найти в статье и дополнительных материалах. Наборы данных, сгенерированные и/или проанализированные во время исследования, доступны от соответствующего автора по разумному запросу.
Ritz-Timme, S. et al. Оценка возраста: состояние искусства для удовлетворения конкретных требований судебной практики. Международность. J. Юридическая медицина. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. и Olze, A. Текущий статус оценки судебного возраста живых субъектов для целей уголовного преследования. Судебная экспертиза. лекарство. Патология. 1, 239–246 (2005).
Pan, J. et al. Модифицированный метод оценки стоматологического возраста детей в возрасте от 5 до 16 лет в восточном Китае. клинический. Устный обзор. 25, 3463–3474 (2021).
Lee, SS и т. Д. Хронология развития второго и третьего моляров у корейцев и его применение для оценки судебного возраста. Международность. J. Юридическая медицина. 124, 659–665 (2010).
OH, S., Kumagai, A., Kim, SY и Lee, Точность оценки возраста и оценка 18-летнего порога на основе зрелости второго и третьего моляров у корейцев и японцев. PLO One 17, E0271247 (2022).
Kim, JY, et al. Анализ данных на основе предоперационного машинного обучения может предсказать результат лечения операции по операциям с сна у пациентов с OSA. Наука. Отчет 11, 14911 (2021).
Хан, М. и соавт. Точная оценка возраста от машинного обучения с или без вмешательства человека? Международность. J. Юридическая медицина. 136, 821–831 (2022).
Хан С. и Шахин М. От интеллектуального анализа данных до интеллектуального анализа данных. J.Information. Наука. https://doi.org/10.1177/01655551511030872 (2021).
Хан, С. и Шахин, М. Висруле: первый когнитивный алгоритм для добычи правил ассоциации. J.Information. Наука. https://doi.org/10.1177/01655515221108695 (2022).
Шахин М. и Абдулла У. Карм: традиционная интеллектуальная информация на основе контекстных правил ассоциации. рассчитать. Матт продолжать. 68, 3305–3322 (2021).
Мухаммед М., Рехман З., Шахин М., Хан М. и Хабиб М. Обнаружение семантического сходства на основе глубокого обучения с использованием текстовых данных. информировать технологии. контроль. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Табиш М., Таноли З. и Шахин М. Система распознавания деятельности в спортивных видео. мультимедиа. Приложения инструментов https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge в педиатрическом возрасте кости. Радиология 290, 498–503 (2019).
Li, Y. et al. Оценка криминалистического возраста из тазовых рентгеновских лучей с использованием глубокого обучения. ЕВРО. излучение. 29, 2322–2329 (2019).
Guo, YC, et al. Точная возрастная классификация с использованием ручных методов и глубоких сверточных нейронных сетей из изображений орфографических проекций. Международность. J. Юридическая медицина. 135, 1589–1597 (2021).
Alabama Dalora et al. Оценка эпохи костного возраста с использованием различных методов машинного обучения: систематический обзор литературы и метаанализ. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. и Yang, J. Оценка возраста, специфичная для населения афроамериканцев и китайцев на основе объемов камеры пульпы первых моляров с использованием компьютерной томографии с конусом. Международность. J. Юридическая медицина. 136, 811–819 (2022).
Ким С., Ли Й.Х., Но.К., Парк Ф.К. и О.С. определяют возрастные группы живых людей, используя изображения первых моляров на основе искусственного интеллекта. Наука. Отчет 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. и Urschler, M. Оценка автоматической оценки возраста и классификация возраста большинства из многомерных данных МРТ. IEEE J. Biomed. Оповещения о здоровье. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. и Li, G. Оценка возраста, основанная на сегментации 3D -камеры из первых моляров из компьютерной томографии конуса путем интегрирования наборов глубокого обучения и уровней. Международность. J. Юридическая медицина. 135, 365–373 (2021).
Wu, WT, et al. Расследование данных в клинических больших данных: общие базы данных, шаги и методы модели. Мир. лекарство. ресурс. 8, 44 (2021).
Yang, J. et al. Введение в медицинские базы данных и технологии анализа данных в эпоху больших данных. J. Avid. Основное лекарство. 13, 57–69 (2020).
Shen, S. et al. Метод Камерера для оценки возраста зубов с использованием машинного обучения. BMC Health 21, 641 (2021).
Galliburg A. et al. Сравнение различных методов машинного обучения для прогнозирования века стоматологического возраста с использованием метода демирджян. Международность. J. Юридическая медицина. 135, 665–675 (2021).
Демирджян А., Гольдштейн Х. и Таннер, JM Новая система для оценки стоматологического возраста. фыркнуть. биология. 45, 211–227 (1973).
Лэндис, младший, и Кох, GG меры соглашения наблюдателя по категориальным данным. Биометрия 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK и Choi HK. Текстурный, морфологический и статистический анализ двумерной магнитно-резонансной томографии с использованием методов искусственного интеллекта для дифференцировки первичных опухолей головного мозга. Медицинская информация. ресурс. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Время сообщения: январь-04-2024