Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Благодарим вас за посещение Nature.com.Используемая вами версия браузера имеет ограниченную поддержку CSS.Для достижения наилучших результатов мы рекомендуем использовать более новую версию браузера (или отключить режим совместимости в Internet Explorer).А пока, чтобы обеспечить постоянную поддержку, мы показываем сайт без стилей и JavaScript.
Зубы считаются наиболее точным показателем возраста человеческого тела и часто используются при судебно-медицинской оценке возраста.Мы стремились проверить оценки стоматологического возраста на основе интеллектуального анализа данных путем сравнения точности оценки и эффективности классификации 18-летнего порога с традиционными методами и оценками возраста на основе интеллектуального анализа данных.Всего было собрано 2657 панорамных рентгенограмм у граждан Кореи и Японии в возрасте от 15 до 23 лет.Они были разделены на обучающий набор, каждый из которых содержал 900 корейских рентгенограмм, и внутренний тестовый набор, содержащий 857 японских рентгенограмм.Мы сравнили точность классификации и эффективность традиционных методов с тестовыми наборами моделей интеллектуального анализа данных.Точность традиционного метода на внутреннем тестовом наборе немного выше, чем точность модели интеллектуального анализа данных, и разница невелика (средняя абсолютная ошибка <0,21 года, среднеквадратическая ошибка <0,24 года).Эффективность классификации для 18-летнего периода также аналогична между традиционными методами и моделями интеллектуального анализа данных.Таким образом, традиционные методы могут быть заменены моделями интеллектуального анализа данных при проведении судебно-медицинской оценки возраста с использованием зрелости вторых и третьих моляров у корейских подростков и молодых людей.
Оценка стоматологического возраста широко используется в судебной медицине и детской стоматологии.В частности, из-за высокой корреляции между хронологическим возрастом и развитием зубов оценка возраста по стадиям развития зубов является важным критерием оценки возраста детей и подростков1,2,3.Однако для молодых людей оценка возраста зубов на основе зрелости зубов имеет свои ограничения, поскольку рост зубов практически завершен, за исключением третьих моляров.Юридическая цель определения возраста молодых людей и подростков заключается в предоставлении точных оценок и научных доказательств того, достигли ли они совершеннолетия.В медико-правовой практике подростков и молодых людей в Корее возраст оценивался с использованием метода Ли, а юридический порог в 18 лет прогнозировался на основе данных, представленных Oh et al 5 .
Машинное обучение — это тип искусственного интеллекта (ИИ), который постоянно изучает и классифицирует большие объемы данных, самостоятельно решает проблемы и управляет программированием данных.Машинное обучение может обнаружить полезные скрытые закономерности в больших объемах данных6.Напротив, классические методы, которые являются трудоемкими и отнимают много времени, могут иметь ограничения при работе с большими объемами сложных данных, которые трудно обрабатывать вручную7.Поэтому в последнее время было проведено множество исследований с использованием новейших компьютерных технологий для минимизации человеческих ошибок и эффективной обработки многомерных данных8,9,10,11,12.В частности, глубокое обучение широко используется при анализе медицинских изображений, и сообщается, что различные методы оценки возраста путем автоматического анализа рентгенограмм повышают точность и эффективность оценки возраста13,14,15,16,17,18,19,20 .Например, Халаби и др. 13 разработали алгоритм машинного обучения на основе сверточных нейронных сетей (CNN) для оценки возраста скелета с использованием рентгенограмм детских рук.В этом исследовании предлагается модель, которая применяет машинное обучение к медицинским изображениям, и показывает, что эти методы могут повысить точность диагностики.Ли и соавт.14 оценили возраст по рентгеновским изображениям таза, используя CNN глубокого обучения, и сравнили их с результатами регрессии, используя оценку стадии окостенения.Они обнаружили, что модель CNN глубокого обучения показала ту же эффективность оценки возраста, что и традиционная регрессионная модель.Исследование Гуо и др. [15] оценило эффективность классификации толерантности к возрасту технологии CNN на основе стоматологических ортофотографий, и результаты модели CNN доказали, что люди превосходят ее эффективность классификации по возрасту.
В большинстве исследований по оценке возраста с использованием машинного обучения используются методы глубокого обучения13,14,15,16,17,18,19,20.Сообщается, что оценка возраста на основе глубокого обучения является более точной, чем традиционные методы.Однако этот подход дает мало возможностей представить научную основу для оценок возраста, например, возрастные показатели, используемые в оценках.Также существует юридический спор по поводу того, кто проводит проверки.Поэтому административные и судебные органы с трудом принимают оценку возраста, основанную на глубоком обучении.Интеллектуальный анализ данных (DM) — это метод, который может обнаруживать не только ожидаемую, но и неожиданную информацию, как метод обнаружения полезных корреляций между большими объемами данных6,21,22.Машинное обучение часто используется при интеллектуальном анализе данных, и как интеллектуальный анализ данных, так и машинное обучение используют одни и те же ключевые алгоритмы для обнаружения закономерностей в данных.Оценка возраста с использованием развития зубов основана на оценке экспертом зрелости целевых зубов, и эта оценка выражается как стадия каждого целевого зуба.DM может использоваться для анализа корреляции между стадией стоматологического обследования и фактическим возрастом и потенциально может заменить традиционный статистический анализ.Следовательно, если мы применим методы DM для оценки возраста, мы сможем реализовать машинное обучение в судебно-медицинской оценке возраста, не беспокоясь о юридической ответственности.Было опубликовано несколько сравнительных исследований возможных альтернатив традиционным ручным методам, используемым в судебно-медицинской практике, и методам, основанным на доказательной медицине, для определения возраста зубов.Шен и др.23 показали, что модель DM более точна, чем традиционная формула Камерера.Галибур и др.24 применили различные методы DM для прогнозирования возраста в соответствии с критерием Демирджиана25, и результаты показали, что метод DM превзошел методы Демирджиана и Виллемса при оценке возраста населения Франции.
Для оценки зубного возраста корейских подростков и молодых людей в корейской судебно-медицинской практике широко используется метод Ли 4.Этот метод использует традиционный статистический анализ (например, множественную регрессию) для изучения взаимосвязи между корейскими испытуемыми и хронологическим возрастом.В данном исследовании методы оценки возраста, полученные с использованием традиционных статистических методов, определяются как «традиционные методы».Метод Ли является традиционным методом, и его точность была подтверждена Oh et al.5;однако применимость оценки возраста на основе модели DM в корейской судебно-медицинской практике все еще остается под вопросом.Нашей целью было научно подтвердить потенциальную полезность оценки возраста на основе модели DM.Целью данного исследования было (1) сравнить точность двух моделей СД при оценке зубного возраста и (2) сравнить эффективность классификации 7 моделей СД в возрасте 18 лет с моделями, полученными с использованием традиционных статистических методов. и третьи моляры на обеих челюстях.
Средние значения и стандартные отклонения хронологического возраста по стадиям и типам зубов показаны онлайн в дополнительной таблице S1 (обучающий набор), дополнительной таблице S2 (внутренний набор тестов) и дополнительной таблице S3 (внешний набор тестов).Значения каппа для внутри- и межисследовательской надежности, полученные из обучающего набора, составили 0,951 и 0,947 соответственно.Значения P и 95% доверительные интервалы для значений каппа показаны в дополнительной онлайн-таблице S4.Значение каппа интерпретировалось как «почти идеальное», что соответствует критериям Ландиса и Коха26.
При сравнении средней абсолютной ошибки (MAE) традиционный метод немного превосходит модель DM для всех полов и на внешней мужской тестовой выборке, за исключением многослойного перцептрона (MLP).Разница между традиционной моделью и моделью СД на внутреннем наборе тестов MAE составила 0,12–0,19 года для мужчин и 0,17–0,21 года для женщин.Для батареи внешних тестов различия меньше (0,001–0,05 года для мужчин и 0,05–0,09 года для женщин).Кроме того, среднеквадратическая ошибка (RMSE) немного ниже, чем у традиционного метода, с меньшими различиями (0,17–0,24, 0,2–0,24 для внутреннего набора тестов для мужчин и 0,03–0,07, 0,04–0,08 для внешнего набора тестов).).MLP показывает немного лучшую производительность, чем однослойный персептрон (SLP), за исключением случая женского внешнего тестового набора.Для MAE и RMSE внешний набор тестов оценивается выше, чем внутренний набор тестов для всех полов и моделей.Все MAE и RMSE показаны в таблице 1 и на рисунке 1.
MAE и RMSE традиционных регрессионных моделей и моделей интеллектуального анализа данных.Средняя абсолютная ошибка MAE, среднеквадратическая ошибка RMSE, однослойный персептрон SLP, многослойный персептрон MLP, традиционный метод CM.
Эффективность классификации (с пороговым значением 18 лет) традиционной модели и модели DM была продемонстрирована с точки зрения чувствительности, специфичности, положительной прогностической ценности (PPV), отрицательной прогностической ценности (NPV) и площади под кривой рабочей характеристики приемника (AUROC). 27 (Таблица 2, Рисунок 2 и дополнительный рисунок 1 онлайн).Что касается чувствительности внутренней батареи тестов, традиционные методы показали лучшие результаты у мужчин и хуже у женщин.Однако разница в эффективности классификации между традиционными методами и SD составляет 9,7% для мужчин (MLP) и всего 2,4% для женщин (XGBoost).Среди моделей СД логистическая регрессия (LR) показала лучшую чувствительность у обоих полов.Что касается специфики внутреннего набора тестов, было отмечено, что четыре модели SD показали хорошие результаты у мужчин, тогда как традиционная модель показала лучшие результаты у женщин.Различия в эффективности классификации для мужчин и женщин составляют 13,3% (MLP) и 13,1% (MLP) соответственно, что указывает на то, что разница в эффективности классификации между моделями превышает чувствительность.Среди моделей DM модели машины опорных векторов (SVM), дерева решений (DT) и случайного леса (RF) показали лучшие результаты среди мужчин, а модель LR показала лучшие результаты среди женщин.AUROC традиционной модели и всех моделей SD превышал 0,925 (k-ближайший сосед (KNN) у мужчин), демонстрируя отличные характеристики классификации при различении 18-летних образцов28.Для внешнего набора тестов наблюдалось снижение эффективности классификации с точки зрения чувствительности, специфичности и AUROC по сравнению с внутренним набором тестов.Более того, разница в чувствительности и специфичности между показателями классификации лучшей и худшей моделей колебалась от 10% до 25% и была больше, чем разница во внутреннем наборе тестов.
Чувствительность и специфичность моделей классификации интеллектуального анализа данных по сравнению с традиционными методами с пороговым значением 18 лет.KNN k ближайший сосед, машина опорных векторов SVM, логистическая регрессия LR, дерево решений DT, случайный лес RF, XGB XGBoost, многослойный персептрон MLP, традиционный метод CM.
Первым шагом в этом исследовании было сравнение точности оценок зубного возраста, полученных на основе семи моделей СД, с точностью, полученной с использованием традиционной регрессии.MAE и RMSE оценивались во внутренних наборах тестов для обоих полов, а разница между традиционным методом и моделью DM составляла от 44 до 77 дней для MAE и от 62 до 88 дней для RMSE.Хотя традиционный метод оказался немного более точным в этом исследовании, трудно сделать вывод, имеет ли такая небольшая разница клиническое или практическое значение.Эти результаты показывают, что точность оценки зубного возраста с использованием модели DM практически такая же, как и у традиционного метода.Прямое сравнение с результатами предыдущих исследований затруднено, поскольку ни в одном исследовании не сравнивалась точность моделей СД с традиционными статистическими методами, использующими ту же технику регистрации зубов в том же возрастном диапазоне, что и в этом исследовании.Galibourg и соавт.24 сравнили MAE и RMSE между двумя традиционными методами (метод Демирджяна25 и метод Виллемса29) и 10 моделями СД во французской популяции в возрасте от 2 до 24 лет.Они сообщили, что все модели DM были более точными, чем традиционные методы, с разницей в 0,20 и 0,38 года в MAE и 0,25 и 0,47 года в RMSE по сравнению с методами Виллемса и Демирджиана соответственно.Несоответствие между моделью SD и традиционными методами, показанное в исследовании Halibourg, учитывает многочисленные сообщения30,31,32,33 о том, что метод Демирджиана неточно оценивает возраст зубов в других популяциях, кроме франко-канадцев, на которых было основано исследование.в этом исследовании.Tai и соавт. 34 использовали алгоритм MLP для прогнозирования возраста зубов по 1636 китайским ортодонтическим фотографиям и сравнили его точность с результатами метода Демирджяна и Виллемса.Они сообщили, что MLP имеет более высокую точность, чем традиционные методы.Разница между методом Демирджяна и традиционным методом составляет <0,32 года, а методом Виллемса – 0,28 года, что аналогично результатам настоящего исследования.Результаты этих предыдущих исследований24,34 также согласуются с результатами настоящего исследования, а точность оценки возраста модели DM и традиционного метода аналогична.Однако на основании представленных результатов мы можем лишь с осторожностью заключить, что использование моделей СД для оценки возраста может заменить существующие методы из-за отсутствия сравнительных и справочных предыдущих исследований.Для подтверждения результатов, полученных в этом исследовании, необходимы последующие исследования с использованием более крупных выборок.
Среди исследований, проверяющих точность СО при оценке возраста зубов, некоторые показали более высокую точность, чем наше исследование.Степановский и др. 35 применили 22 модели SD к панорамным рентгенограммам 976 жителей Чехии в возрасте от 2,7 до 20,5 лет и проверили точность каждой модели.Они оценили развитие в общей сложности 16 верхних и нижних левых постоянных зубов, используя критерии классификации, предложенные Moorrees et al 36.MAE колеблется от 0,64 до 0,94 года, а RMSE — от 0,85 до 1,27 года, что более точно, чем две модели DM, использованные в этом исследовании.Shen и соавт.23 использовали метод Камерьера для оценки зубного возраста семи постоянных зубов на левой нижней челюсти у жителей Восточного Китая в возрасте от 5 до 13 лет и сравнили его с возрастом, оцененным с помощью линейной регрессии, SVM и RF.Они показали, что все три модели DM имеют более высокую точность по сравнению с традиционной формулой Cameriere.MAE и RMSE в исследовании Шена были ниже, чем в модели DM в этом исследовании.Повышенная точность исследований Степановского с соавт.35 и Шен и др.23, возможно, связано с включением в выборку более молодых субъектов.Поскольку оценки возраста участников с развивающимися зубами становятся более точными по мере увеличения количества зубов в процессе развития зубов, точность полученного метода оценки возраста может быть поставлена под угрозу, когда участники исследования моложе.Кроме того, ошибка MLP в оценке возраста немного меньше, чем у SLP, а это означает, что MLP более точен, чем SLP.MLP считается немного лучшим для оценки возраста, возможно, из-за скрытых слоев в MLP38.Однако есть исключение для внешней выборки женщин (SLP 1,45, MLP 1,49).Вывод о том, что MLP более точен, чем SLP, при оценке возраста, требует дополнительных ретроспективных исследований.
Также сравнивалась эффективность классификации модели DM и традиционного метода на 18-летнем пороге.Все проверенные модели SD и традиционные методы на внутреннем тестовом наборе показали практически приемлемый уровень дискриминации для 18-летней выборки.Чувствительность для мужчин и женщин составила более 87,7% и 94,9% соответственно, а специфичность — более 89,3% и 84,7%.AUROC всех протестированных моделей также превышает 0,925.Насколько нам известно, ни одно исследование не проверяло эффективность модели DM для 18-летней классификации на основе зрелости зубов.Мы можем сравнить результаты этого исследования с эффективностью классификации моделей глубокого обучения на панорамных рентгенограммах.Гуо и др.15 рассчитали эффективность классификации модели глубокого обучения на основе CNN и ручного метода, основанного на методе Демирджяна, для определенного возрастного порога.Чувствительность и специфичность ручного метода составила 87,7% и 95,5% соответственно, а чувствительность и специфичность модели CNN превысили 89,2% и 86,6% соответственно.Они пришли к выводу, что модели глубокого обучения могут заменить или превзойти ручную оценку при классификации возрастных порогов.Результаты этого исследования показали аналогичную эффективность классификации;Считается, что классификация с использованием моделей СД может заменить традиционные статистические методы оценки возраста.Среди моделей DM LR была лучшей моделью с точки зрения чувствительности для мужской выборки и чувствительности и специфичности для женской выборки.ЛР занимает второе место по специфичности у мужчин.Более того, LR считается одной из наиболее удобных в использовании моделей DM35, она менее сложна и сложна в обработке.На основании этих результатов LR считалась лучшей моделью классификации для 18-летних среди населения Кореи.
В целом точность оценки возраста или эффективности классификации на внешнем наборе тестов была плохой или ниже по сравнению с результатами на внутреннем наборе тестов.В некоторых отчетах указывается, что точность или эффективность классификации снижается, когда оценки возраста, основанные на корейском населении, применяются к японскому населению5,39, и аналогичная закономерность была обнаружена в настоящем исследовании.Эта тенденция ухудшения наблюдалась и в модели DM.Следовательно, для точной оценки возраста, даже при использовании СД в процессе анализа, следует отдавать предпочтение методам, полученным на основе данных о местном населении, например, традиционным методам5,39,40,41,42.Поскольку неясно, могут ли модели глубокого обучения демонстрировать аналогичные тенденции, необходимы исследования, сравнивающие точность и эффективность классификации с использованием традиционных методов, моделей DM и моделей глубокого обучения на одних и тех же выборках, чтобы подтвердить, может ли искусственный интеллект преодолеть эти расовые различия в ограниченном возрасте.оценки.
Мы демонстрируем, что традиционные методы могут быть заменены оценкой возраста на основе модели DM в практике судебно-медицинской оценки возраста в Корее.Мы также обнаружили возможность применения машинного обучения для судебно-медицинской оценки возраста.Однако существуют явные ограничения, такие как недостаточное количество участников этого исследования для окончательного определения результатов, а также отсутствие предыдущих исследований для сравнения и подтверждения результатов этого исследования.В будущем исследования СД должны проводиться с использованием большего количества образцов и более разнообразных популяций, чтобы улучшить его практическую применимость по сравнению с традиционными методами.Чтобы подтвердить возможность использования искусственного интеллекта для оценки возраста в нескольких популяциях, необходимы будущие исследования для сравнения точности классификации и эффективности моделей DM и глубокого обучения с традиционными методами в тех же выборках.
В исследовании использовались 2657 орфографических фотографий, собранных у взрослых корейцев и японцев в возрасте от 15 до 23 лет.Корейские рентгенограммы были разделены на 900 обучающих наборов (19,42 ± 2,65 года) и 900 внутренних тестовых наборов (19,52 ± 2,59 года).Обучающий набор был собран в одном учреждении (Сеульская больница Святой Марии), а собственный тестовый набор был собран в двух учреждениях (стоматологическая больница Сеульского национального университета и стоматологическая больница университета Йонсей).Мы также собрали 857 рентгенограмм из других популяционных данных (Медицинский университет Иватэ, Япония) для внешнего тестирования.В качестве внешнего набора тестов были выбраны рентгенограммы японцев (19,31 ± 2,60 года).Данные были собраны ретроспективно для анализа стадий развития зубов на панорамных рентгенограммах, сделанных во время стоматологического лечения.Все собранные данные были анонимными, за исключением пола, даты рождения и даты рентгенограммы.Критерии включения и исключения были такими же, как и в ранее опубликованных исследованиях 4, 5 .Фактический возраст выборки рассчитывался путем вычитания даты рождения из даты, когда была сделана рентгенограмма.Выборочная группа была разделена на девять возрастных групп.Распределение по возрасту и полу показано в Таблице 3. Это исследование было проведено в соответствии с Хельсинкской декларацией и одобрено Институциональным наблюдательным советом (IRB) Сеульской больницы Святой Марии Католического университета Кореи (KC22WISI0328).Из-за ретроспективного дизайна этого исследования не удалось получить информированное согласие от всех пациентов, проходящих рентгенографическое обследование в терапевтических целях.Больница Святой Марии Сеульского Корейского университета (IRB) отказалась от требования информированного согласия.
Стадии развития бимаксиллярных вторых и третьих моляров оценивались в соответствии с критериями Демиркана25.Выбирался только один зуб, если на левой и правой сторонах каждой челюсти обнаруживался один и тот же тип зуба.Если гомологичные зубы с обеих сторон находились на разных стадиях развития, выбирался зуб с более низкой стадией развития, чтобы учесть неопределенность в предполагаемом возрасте.Сто случайно выбранных рентгенограмм из обучающей выборки были оценены двумя опытными наблюдателями для проверки надежности взаимодействия между наблюдателями после предварительной калибровки для определения стадии зрелости зубов.Надежность внутри наблюдателя оценивалась дважды с трехмесячными интервалами основным наблюдателем.
Пол и стадия развития вторых и третьих моляров каждой челюсти в обучающей выборке оценивались основным наблюдателем, обученным с использованием различных моделей DM, а фактический возраст был установлен в качестве целевого значения.Модели SLP и MLP, которые широко используются в машинном обучении, были протестированы на основе алгоритмов регрессии.Модель DM объединяет линейные функции с использованием стадий развития четырех зубов и объединяет эти данные для оценки возраста.SLP является простейшей нейронной сетью и не содержит скрытых слоев.SLP работает на основе пороговой передачи между узлами.Модель SLP в регрессии математически похожа на множественную линейную регрессию.В отличие от модели SLP, модель MLP имеет несколько скрытых слоев с нелинейными функциями активации.В наших экспериментах использовался скрытый слой всего с 20 скрытыми узлами с нелинейными функциями активации.Используйте градиентный спуск в качестве метода оптимизации, а MAE и RMSE в качестве функции потерь для обучения нашей модели машинного обучения.Наилучшая полученная регрессионная модель была применена к внутренним и внешним тестовым наборам и был оценен возраст зубов.
Был разработан алгоритм классификации, который использует зрелость четырех зубов на обучающем наборе для прогнозирования возраста выборки 18 лет или нет.Чтобы построить модель, мы получили семь алгоритмов машинного обучения представления6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost и (7) MLP. .LR — один из наиболее широко используемых алгоритмов классификации44.Это алгоритм обучения с учителем, который использует регрессию для прогнозирования вероятности принадлежности данных к определенной категории от 0 до 1 и классифицирует данные как принадлежащие к более вероятной категории на основе этой вероятности;в основном используется для бинарной классификации.KNN — один из простейших алгоритмов машинного обучения45.При получении новых входных данных он находит k данных, близких к существующему набору, а затем классифицирует их в класс с самой высокой частотой.Мы устанавливаем 3 для количества рассматриваемых соседей (k).SVM — это алгоритм, который максимизирует расстояние между двумя классами, используя функцию ядра для расширения линейного пространства в нелинейное пространство, называемое полями46.Для этой модели мы используем смещение = 1, мощность = 1 и гамма = 1 в качестве гиперпараметров для полиномиального ядра.DT применялся в различных областях как алгоритм разделения всего набора данных на несколько подгрупп путем представления правил принятия решений в древовидной структуре47.Модель настроена с минимальным количеством записей на узел, равным 2, и использует индекс Джини в качестве меры качества.RF — это ансамблевый метод, который объединяет несколько DT для повышения производительности с использованием метода бутстреп-агрегации, который генерирует слабый классификатор для каждой выборки путем случайного отбора выборок одного и того же размера несколько раз из исходного набора данных48.В качестве критериев разделения узлов мы использовали 100 деревьев, 10 глубин дерева, 1 минимальный размер узла и индекс примеси Джини.Классификация новых данных определяется большинством голосов.XGBoost — это алгоритм, который сочетает в себе методы повышения с использованием метода, который принимает в качестве обучающих данных ошибку между фактическими и прогнозируемыми значениями предыдущей модели и увеличивает ошибку с помощью градиентов49.Это широко используемый алгоритм благодаря его хорошей производительности и эффективности использования ресурсов, а также высокой надежности в качестве функции коррекции переоснащения.Модель оснащена 400 опорными колесами.MLP — это нейронная сеть, в которой один или несколько перцептронов образуют несколько слоев с одним или несколькими скрытыми слоями между входным и выходным слоями38.Используя это, вы можете выполнить нелинейную классификацию, при которой, когда вы добавляете входной слой и получаете значение результата, прогнозируемое значение результата сравнивается с фактическим значением результата, и ошибка распространяется обратно.Мы создали скрытый слой с 20 скрытыми нейронами в каждом слое.Каждая разработанная нами модель применялась к внутренним и внешним наборам для проверки эффективности классификации путем расчета чувствительности, специфичности, PPV, NPV и AUROC.Чувствительность определяется как отношение выборки в возрасте 18 лет и старше к выборке в возрасте 18 лет и старше.Специфичность – это доля образцов в возрасте до 18 лет и тех, кто, по оценкам, моложе 18 лет.
Стоматологические этапы, оцененные в обучающем наборе, были преобразованы в числовые этапы для статистического анализа.Многомерная линейная и логистическая регрессия была проведена для разработки прогностических моделей для каждого пола и вывода формул регрессии, которые можно использовать для оценки возраста.Мы использовали эти формулы для оценки возраста зубов как для внутренних, так и для внешних тестовых наборов.В таблице 4 показаны модели регрессии и классификации, использованные в этом исследовании.
Надежность внутри и между наблюдателями рассчитывалась с использованием каппа-статистики Коэна.Чтобы проверить точность DM и традиционных регрессионных моделей, мы рассчитали MAE и RMSE, используя предполагаемый и фактический возраст внутренних и внешних наборов тестов.Эти ошибки обычно используются для оценки точности прогнозов модели.Чем меньше ошибка, тем выше точность прогноза24.Сравните MAE и RMSE внутренних и внешних наборов тестов, рассчитанных с использованием DM и традиционной регрессии.Эффективность классификации 18-летнего порога в традиционной статистике оценивалась с использованием таблицы непредвиденных обстоятельств 2 × 2.Рассчитанные чувствительность, специфичность, PPV, NPV и AUROC тестового набора сравнивались с измеренными значениями модели классификации DM.Данные выражаются как среднее значение ± стандартное отклонение или число (%) в зависимости от характеристик данных.Двусторонние значения P <0,05 считались статистически значимыми.Все рутинные статистические анализы проводились с использованием SAS версии 9.4 (Институт SAS, Кэри, Северная Каролина).Модель регрессии DM была реализована на Python с использованием бэкэнда Keras50 2.2.4 и Tensorflow51 1.8.0 специально для математических операций.Модель классификации DM была реализована в среде анализа знаний Waikato и платформе анализа Konstanz Information Miner (KNIME) 4.6.152.
Авторы признают, что данные, подтверждающие выводы исследования, можно найти в статье и дополнительных материалах.Наборы данных, созданные и/или проанализированные в ходе исследования, можно получить у соответствующего автора по обоснованному запросу.
Ритц-Тимме, С. и др.Оценка возраста: современное состояние, отвечающее конкретным требованиям судебно-медицинской практики.интернациональность.Ж. Юридическая медицина.113, 129–136 (2000).
Шмелинг А., Райзингер В., Гезерик Г. и Ольце А. Текущее состояние судебно-медицинской оценки возраста живых субъектов для целей уголовного преследования.Криминалистика.лекарство.Патология.1, 239–246 (2005).
Пан, Дж. и др.Модифицированный метод оценки зубного возраста детей в возрасте от 5 до 16 лет в восточном Китае.клинический.Устный опрос.25, 3463–3474 (2021).
Ли, С.С. и др. Хронология развития вторых и третьих моляров у корейцев и ее применение для судебно-медицинской оценки возраста.интернациональность.Ж. Юридическая медицина.124, 659–665 (2010).
О, С., Кумагай, А., Ким, С.Ю. и Ли, С.С. Точность оценки возраста и оценки 18-летнего порога на основе зрелости вторых и третьих моляров у корейцев и японцев.PLoS ONE 17, e0271247 (2022).
Ким, JY и др.Предоперационный анализ данных на основе машинного обучения может предсказать результат лечения хирургического вмешательства во сне у пациентов с СОАС.наука.Отчет 11, 14911 (2021 г.).
Хан, М. и др.Точная оценка возраста с помощью машинного обучения с участием человека или без него?интернациональность.Ж. Юридическая медицина.136, 821–831 (2022).
Хан С. и Шахин М. От интеллектуального анализа данных к интеллектуальному анализу данных.J.Информация.наука.https://doi.org/10.1177/01655515211030872 (2021 г.).
Хан С. и Шахин М. WisRule: первый когнитивный алгоритм для анализа ассоциативных правил.J.Информация.наука.https://doi.org/10.1177/01655515221108695 (2022 г.).
Шахин М. и Абдулла У. Карм: Традиционный интеллектуальный анализ данных, основанный на правилах ассоциации на основе контекста.рассчитать.Мэтт.продолжать.68, 3305–3322 (2021).
Мухаммад М., Рехман З., Шахин М., Хан М. и Хабиб М. Обнаружение семантического сходства на основе глубокого обучения с использованием текстовых данных.поставить в известность.технологии.контроль.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Табиш М., Таноли З. и Шахин М. Система распознавания активности в спортивных видеороликах.мультимедиа.Инструменты Приложения https://doi.org/10.1007/s11042-021-10519-6 (2021).
Халаби, С.С. и др.Задача машинного обучения RSNA в педиатрическом костном возрасте.Радиология 290, 498–503 (2019).
Ли, Ю. и др.Судебно-медицинская оценка возраста по рентгенограммам таза с использованием глубокого обучения.ЕВРО.радиация.29, 2322–2329 (2019).
Го, YC и др.Точная возрастная классификация с использованием ручных методов и глубоких сверточных нейронных сетей на основе изображений ортогональной проекции.интернациональность.Ж. Юридическая медицина.135, 1589–1597 (2021).
Алабама Далора и др.Оценка костного возраста с использованием различных методов машинного обучения: систематический обзор литературы и метаанализ.PLoS ONE 14, e0220242 (2019).
Ду Х., Ли Г., Ченг К. и Ян Дж. Оценка возраста афроамериканцев и китайцев для конкретной популяции на основе объемов пульпарной камеры первых коренных зубов с использованием конусно-лучевой компьютерной томографии.интернациональность.Ж. Юридическая медицина.136, 811–819 (2022).
Ким С., Ли Ю.Х., Но Ю.К., Пак Ф.К. и О К.С. Определение возрастных групп живых людей с использованием изображений первых моляров на основе искусственного интеллекта.наука.Отчет 11, 1073 (2021 г.).
Стерн Д., Пайер К., Джулиани Н. и Уршлер М. Автоматическая оценка возраста и классификация возраста большинства на основе многомерных данных МРТ.IEEE Дж. Биомед.Оповещения о здоровье.23, 1392–1403 (2019).
Ченг К., Ге З., Ду Х. и Ли Г. Оценка возраста на основе трехмерной сегментации пульпарной камеры первых моляров по данным конусно-лучевой компьютерной томографии путем интеграции наборов глубокого обучения и уровней.интернациональность.Ж. Юридическая медицина.135, 365–373 (2021).
Ву, WT и др.Интеллектуальный анализ данных в области больших клинических данных: общие базы данных, этапы и модели методов.Мир.лекарство.ресурс.8, 44 (2021).
Ян, Дж. и др.Введение в медицинские базы данных и технологии интеллектуального анализа данных в эпоху больших данных.Дж. Авид.Базовая медицина.13, 57–69 (2020).
Шен, С. и др.Метод Камерера для оценки возраста зубов с помощью машинного обучения.BMC Oral Health 21, 641 (2021 г.).
Галлибург А. и др.Сравнение различных методов машинного обучения для прогнозирования возраста зубов с использованием метода стадирования Демирджяна.интернациональность.Ж. Юридическая медицина.135, 665–675 (2021).
Демирджян А., Гольдштейн Х. и Таннер Дж. М. Новая система оценки возраста зубов.фыркать.биология.45, 211–227 (1973).
Лэндис Дж. Р. и Кох Г. Г. Меры согласия наблюдателей по категориальным данным.Биометрия 33, 159–174 (1977).
Бхаттачарджи С., Пракаш Д., Ким С., Ким Х.К. и Чой Х.К.Текстурный, морфологический и статистический анализ двумерной магнитно-резонансной томографии с использованием методов искусственного интеллекта для дифференциации первичных опухолей головного мозга.Информация о здоровье.ресурс.https://doi.org/10.4258/hir.2022.28.1.46 (2022 г.).

Время публикации: 04 января 2024 г.