Дзякуй за наведванне Nature.com. Версія браўзэра, які вы выкарыстоўваеце, мае абмежаваную падтрымку CSS. Для дасягнення найлепшых вынікаў мы рэкамендуем выкарыстоўваць больш новую версію вашага браўзэра (альбо адключыць рэжым сумяшчальнасці ў Internet Explorer). У той жа час, каб забяспечыць пастаянную падтрымку, мы паказваем сайт без кладкі і JavaScript.
Зубы лічацца найбольш дакладным паказчыкам узросту чалавечага цела і часта выкарыстоўваюцца ў судовай ацэнцы ўзросту. Мы імкнуліся праверыць ацэнкі стаматалагічнага ўзросту на аснове дадзеных на аснове дадзеных, параўноўваючы дакладнасць ацэнкі і прадукцыйнасць класіфікацыі 18-гадовага парога з традыцыйнымі метадамі і ацэнкамі на аснове дадзеных. Усяго ў карэйскіх і японскіх грамадзян было сабрана 2657 панарамных рэнтгенаграмаў ва ўзросце ад 15 да 23 гадоў. Яны былі падзелены на навучальны набор, кожны з якіх змяшчаў 900 карэйскіх рэнтгенаграмаў, і ўнутраны тэставы набор, які змяшчае 857 японскіх рэнтгенаграмаў. Мы параўналі дакладнасць класіфікацыі і эфектыўнасць традыцыйных метадаў з тэставымі наборамі мадэляў майнинга дадзеных. Дакладнасць традыцыйнага метаду ва ўнутраным тэставым наборы крыху вышэй, чым у мадэлі майнинга дадзеных, і розніца малая (сярэдняя абсалютная памылка <0,21 гадоў, сярэдняя квадратная памылка каранёвай <0,24 года). Прадукцыйнасць класіфікацыі для 18-гадовага адсячэння таксама падобная паміж традыцыйнымі метадамі і мадэлямі здабычы дадзеных. Такім чынам, традыцыйныя метады могуць быць заменены мадэлямі майнинга дадзеных пры выкананні судова -медыцынскай ацэнкі з выкарыстаннем сталасці другой і трэціх карэньчыкаў у карэйскіх падлеткаў і маладых людзей.
Ацэнка ўзросту стаматалагічнай стаматакі шырока выкарыстоўваецца ў судовай медыцыне і дзіцячай стаматалогіі. У прыватнасці, з -за высокай карэляцыі паміж храналагічным узростам і стаматалагічным развіццём, узроставая ацэнка стадыямі развіцця зубоў з'яўляецца важным крытэрыем для ацэнкі ўзросту дзяцей і падлеткаў1,2,3. Аднак для маладых людзей ацэньванне стаматалагічнага ўзросту на аснове стаматалагічнай сталасці мае свае абмежаванні, паколькі рост зубоў практычна завершаны, за выключэннем трэціх карэнных зубоў. Юрыдычная мэта вызначэння ўзросту моладзі і падлеткаў заключаецца ў прадастаўленні дакладных ацэнак і навуковых доказаў таго, ці дасягнулі яны ўзросту большасці. У практыцы медыка-прававой практыкі падлеткаў і маладых людзей у Карэі ўзрост ацэньваўся з выкарыстаннем метаду Лі, і быў прагназаваны юрыдычны парог 18 гадоў на аснове дадзеных, пра якія паведамляюць OH et al.
Машыннае навучанне - гэта тып штучнага інтэлекту (AI), які неаднаразова вывучае і класіфікуе вялікую колькасць дадзеных, вырашае праблемы самастойна і рухае праграмаваннем дадзеных. Машыннае навучанне можа выявіць карысныя схаваныя ўзоры ў вялікіх аб'ёмах дадзеных6. У адрозненне ад гэтага, класічныя метады, якія працуюць на працаёмкую і працаёмкую, могуць мець абмежаванні пры працы з вялікімі аб'ёмамі складаных дадзеных, якія складана апрацоўваць уручную 7. Такім чынам, нядаўна было праведзена шматлікія даследаванні з выкарыстаннем апошніх камп'ютэрных тэхналогій для мінімізацыі чалавечых памылак і эфектыўнай апрацоўкі шматмерных дадзеных 8,9,10,11,12. У прыватнасці, паведамлялася, што глыбокае навучанне шырока выкарыстоўваецца ў аналізе медыцынскіх малюнкаў, і, як паведамляецца . Напрыклад, Халабі і інш 13 распрацавалі алгарытм машыннага навучання, заснаваны на скручлівых нейронных сетках (CNN) для ацэнкі шкілетнага ўзросту з выкарыстаннем рэнтгенаграмаў дзяцей. У гэтым даследаванні прапануецца мадэль, якая прымяняе машыннае навучанне да медыцынскіх малюнкаў і паказвае, што гэтыя метады могуць павысіць дыягнастычную дакладнасць. Li et al14, разліковы ўзрост з рэнтгенаўскіх малюнкаў таза, выкарыстоўваючы глыбокае навучанне CNN і параўноўваў іх з вынікамі рэгрэсіі, выкарыстоўваючы ацэнку стадыі акасціфікацыі. Яны выявілі, што мадэль Deep Learning CNN паказала тое ж самае ўзроставае ацэнку, што і традыцыйная мадэль рэгрэсіі. Даследаванне Го і інш.
У большасці даследаванняў па ацэнцы ўзросту з выкарыстаннем машыннага навучання выкарыстоўваюцца метады глыбокага навучання 13,14,15,16,17,18,19,20. Паведамляецца, што ўзроставая ацэнка, заснаваная на глыбокім навучанні, з'яўляецца больш дакладнай, чым традыцыйныя метады. Аднак такі падыход дае мала магчымасці прадставіць навуковую аснову для ўзроставых ацэнак, такіх як узроставыя паказчыкі, якія выкарыстоўваюцца ў ацэнках. Існуе таксама юрыдычная спрэчка з нагоды таго, хто праводзіць праверкі. Такім чынам, узроставая ацэнка, заснаваная на глыбокім навучанні, цяжка прыняць адміністрацыйныя і судовыя органы. Здабыча дадзеных (DM) - гэта методыка, якая можа выявіць не толькі чаканую, але і нечаканую інфармацыю як метад выяўлення карыснай карэляцыі паміж вялікай колькасцю дадзеных 6,21,22. Машыннае навучанне часта выкарыстоўваецца ў майнингу дадзеных, і як майнинг дадзеных і машыннае навучанне выкарыстоўваюць тыя ж ключавыя алгарытмы, каб выявіць мадэлі дадзеных. Ацэнка ўзросту з выкарыстаннем стаматалагічнага развіцця заснавана на ацэнцы экзаменатара на сталасць мэтавых зубоў, і гэтая ацэнка выражаецца як этап для кожнага мэтавага зуба. DM можа быць выкарыстаны для аналізу карэляцыі паміж стадыяй ацэнкі зубоў і фактычным узростам і мае патэнцыял для замены традыцыйнага статыстычнага аналізу. Такім чынам, калі мы ўжываем метады DM для ацэнкі ўзросту, мы можам рэалізаваць машыннае навучанне ў ацэнцы судова -медыцынскай экспертызы, не клапоцячыся пра юрыдычную адказнасць. Было апублікавана некалькі параўнальных даследаванняў на магчымых альтэрнатывах традыцыйным ручным метадам, якія выкарыстоўваюцца ў судовай практыцы і метадах на аснове EBM для вызначэння ўзросту зубоў. Shen et al23 паказалі, што мадэль DM больш дакладная, чым традыцыйная формула Camerer. Galibourg і інш.
Для ацэнкі стаматалагічнага ўзросту карэйскіх падлеткаў і маладых людзей метад Лі шырока выкарыстоўваецца ў карэйскай судовай практыцы. Гэты метад выкарыстоўвае традыцыйны статыстычны аналіз (напрыклад, шматлікія рэгрэсіі) для вывучэння сувязі паміж карэйскімі прадметамі і храналагічным узростам. У гэтым даследаванні метады ацэнкі ўзросту, атрыманыя з выкарыстаннем традыцыйных статыстычных метадаў, вызначаюцца як "традыцыйныя метады". Метад Лі - гэта традыцыйны метад, і яго дакладнасць была пацверджана OH і інш. 5; Аднак прыдатнасць ацэнкі ўзросту на аснове мадэлі DM у карэйскай судовай практыцы па -ранейшаму выклікае сумневы. Нашай мэтай было навукова пацвердзіць патэнцыйную карыснасць ацэнкі ўзросту на аснове мадэлі DM. Мэтай гэтага даследавання было (1) для параўнання дакладнасці дзвюх мадэляў DM для ацэнкі стаматалагічнага ўзросту і (2) для параўнання класіфікацыйнай прадукцыйнасці 7 мадэляў DM ва ўзросце 18 гадоў з тымі, якія атрымлівалі з выкарыстаннем традыцыйных статыстычных метадаў сталасці другога і трэція карэньчыкі ў абедзвюх сківіцах.
Сродкі і стандартныя адхіленні храналагічнага ўзросту па этапе і тыпу зуба паказаны ў Інтэрнэце ў дадатковай табліцы S1 (навучальны набор), дадатковай табліцы S2 (унутранага тэставага набору) і дадатковай табліцы S3 (знешні тэставы набор). Значэнні KAPPA для надзейнасці ўнутры- і інтэрабараванай, атрыманай з навучальнага набору, склалі 0,951 і 0,947 адпаведна. Значэнні P і 95% даверныя інтэрвалы для значэнняў KAPPA прыведзены ў дадатковай табліцы S4. Значэнне Kappa тлумачылася як "амаль дасканалая", што адпавядае крытэрыям Landis і Koch26.
Параўноўваючы сярэднюю абсалютную памылку (MAE), традыцыйны метад злёгку пераўзыходзіць мадэль DM для ўсіх полаў і ў знешнім тэставым наборы мужчынскага полу, за выключэннем шматслойнага PercePtron (MLP). Розніца паміж традыцыйнай мадэллю і мадэллю DM ва ўнутраным тэставым наборы MAE склала 0,12–0,19 года для мужчын і 0,17–0,21 года для жанчын. Для вонкавага выпрабавальнага батарэі адрозненні меншыя (0,001–0,05 года для мужчын і 0,05–0,09 года для жанчын). Акрамя таго, сярэдняя квадратная памылка (RMSE) крыху ніжэй, чым традыцыйны метад, з меншымі адрозненнямі (0,17–0,24, 0,2–0,24 для ўнутранага тэставага набору мужчын і 0,03–0,07, 0,04–0,08 для знешняга тэставага набору). ). MLP паказвае крыху больш высокую прадукцыйнасць, чым аднаразовы ўспрыманне (SLP), за выключэннем выпадкаў знешняга тэставага набору самкі. Для MAE і RMSE, знешні набор тэставых набораў вышэй, чым унутраныя тэставыя наборы для ўсіх полаў і мадэляў. Усе MAE і RMSE прыведзены ў табліцы 1 і на малюнку 1.
MAE і RMSE традыцыйных і рэгрэсійных мадэляў майнинга дадзеных. Сярэдняя абсалютная памылка MAE, каранёвая сярэдняя памылка RMSE, аднапласны PercePtron SLP, шматслаёвы PercePtron MLP, традыцыйны метад CM.
Прадэманстравана прадукцыйнасць класіфікацыі (з адсячэннем 18 гадоў) традыцыйных і DM -мадэляў з пункту гледжання адчувальнасці, спецыфічнасці, станоўчага прагнастычнага значэння (PPV), адмоўнага прагнастычнага значэння (NPV) і вобласці ў рамках характарыстычнай крывой прыёмніка (AUROC) (AUROC) 27 (табліца 2, малюнак 2 і дадатковы малюнак 1 у Інтэрнэце). З пункту гледжання адчувальнасці ўнутранай тэставай батарэі, традыцыйныя метады выконваліся лепш за ўсё сярод мужчын і яшчэ горш сярод жанчын. Аднак розніца ў прадукцыйнасці класіфікацыі паміж традыцыйнымі метадамі і SD складае 9,7% для мужчын (MLP) і толькі 2,4% для жанчын (XGBOOST). Сярод мадэляў DM лагістычная рэгрэсія (LR) паказала лепшую адчувальнасць у абодвух полаў. Што тычыцца спецыфікі ўнутранага тэставага набору, то было заўважана, што чатыры мадэлі SD добра праводзіліся ў мужчын, у той час як традыцыйная мадэль працавала лепш у жанчын. Адрозненні ў эфектыўнасці класіфікацыі для мужчын і жанчын складаюць 13,3% (MLP) і 13,1% (MLP), адпаведна, што сведчыць аб тым, што розніца ў прадукцыйнасці класіфікацыі паміж мадэлямі перавышае адчувальнасць. Сярод мадэляў DM, мадэлі падтрымкі вектарнай машыны (SVM), дрэва рашэнняў (DT) і выпадковых лесу (РФ) выконвалі найлепшыя сярод мужчын, у той час як мадэль LR была лепш за ўсё сярод жанчын. AUROC традыцыйнай мадэлі і ўсіх мадэляў SD быў больш за 0,925 (K-Nearest сусед (KNN) у мужчын), дэманструючы выдатныя паказчыкі класіфікацыі ў дыскрымінацыі 18-гадовых узораў28. Для знешняга тэставага набору адбылося зніжэнне прадукцыйнасці класіфікацыі ў плане адчувальнасці, спецыфікі і AUROC у параўнанні з унутраным тэставым наборам. Больш за тое, розніца ў адчувальнасці і спецыфічнасці паміж класіфікацыйнымі характарыстыкамі лепшых і горшых мадэляў вагалася ад 10% да 25% і была большай, чым розніца ва ўнутраным тэставым наборы.
Адчувальнасць і спецыфічнасць мадэляў класіфікацыі майнинга дадзеных у параўнанні з традыцыйнымі метадамі з адсячэннем 18 гадоў. Knn K бліжэйшы сусед, вектарная машына падтрымкі SVM, LR лагістычная рэгрэсія, дрэва рашэнняў DT, RF Renade Forest, XGB XGBOOST, MLP шматслаёвы Perceptron, традыцыйны метад CM.
Першым этапам у гэтым даследаванні было параўнанне дакладнасці ацэнак стаматалагічнага ўзросту, атрыманых з сямі мадэляў DM, з тымі, якія атрымалі з выкарыстаннем традыцыйнай рэгрэсіі. MAE і RMSE ацэньваліся ва ўнутраных тэставых наборах для абодвух полаў, а розніца паміж традыцыйным метадам і мадэллю DM вагалася ад 44 да 77 дзён для MAE і ад 62 да 88 дзён для RMSE. Хоць традыцыйны метад быў крыху больш дакладным у гэтым даследаванні, цяжка зрабіць выснову, ці мае такую невялікую розніцу клінічнае ці практычнае значэнне. Гэтыя вынікі паказваюць, што дакладнасць ацэнкі стаматалагічнага ўзросту з выкарыстаннем мадэлі DM практычна супадае з традыцыйным метадам. Непасрэднае параўнанне з вынікамі папярэдніх даследаванняў складана, таму што ні адно даследаванне не параўнала дакладнасць мадэляў DM з традыцыйнымі статыстычнымі метадамі, выкарыстоўваючы тую ж методыку запісу зубоў у тым жа ўзроставым дыяпазоне, што і ў гэтым даследаванні. Galibourg et al24 параўноўваюць MAE і RMSE паміж двума традыцыйнымі метадамі (Demirian Method25 і Willems Method29) і 10 DM мадэлямі ў французскім насельніцтва ва ўзросце ад 2 да 24 гадоў. Яны паведамілі, што ўсе мадэлі DM былі больш дакладнымі, чым традыцыйныя метады, з розніцамі ў 0,20 і 0,38 года ў MAE і 0,25 і 0,47 года ў RMSE ў параўнанні з метадамі Вілема і Дэмірджыямі адпаведна. Разыходжанне паміж мадэллю SD і традыцыйнымі метадамі, паказанымі ў даследаванні Halibourg, улічвае шматлікія справаздачы 30,31,32,33, што метад DeMirdjian не дакладна ацэньвае ўзрост зубоў у іншых папуляцыях, акрамя французскіх канадцаў, на якіх грунтавалася даследаванне. У гэтым даследаванні. Тай і інш 34 выкарыстоўвалі алгарытм MLP для прагназавання ўзросту зуба з 1636 г. кітайскіх артадантычных фатаграфій і параўноўваюць яго дакладнасць з вынікамі метаду Demirjian і Wilems. Яны паведамілі, што MLP мае больш высокую дакладнасць, чым традыцыйныя метады. Розніца паміж метадам Demirdjian і традыцыйным метадам складае <0,32 года, а метад Вілемса складае 0,28 года, што падобна на вынікі гэтага даследавання. Вынікі гэтых папярэдніх даследаванняў24,34 таксама адпавядаюць вынікам гэтага даследавання, а дакладнасць ацэнкі ўзросту мадэлі DM і традыцыйны метад падобныя. Аднак, грунтуючыся на прадстаўленых выніках, можна толькі асцярожна зрабіць выснову, што выкарыстанне мадэляў DM для ацэнкі ўзросту можа замяніць існуючыя метады з -за адсутнасці параўнальных і спасылак на папярэднія даследаванні. Наступныя даследаванні з выкарыстаннем вялікіх узораў неабходныя для пацверджання вынікаў, атрыманых у гэтым даследаванні.
Сярод даследаванняў, якія тэстуюць дакладнасць SD для ацэнкі стаматалагічнага ўзросту, некаторыя прадэманстравалі больш высокую дакладнасць, чым наша даследаванне. Speanovsky et al. 35 ужылі 22 мадэлі SD да панарамных рэнтгенаграмаў 976 чэшскіх жыхароў ва ўзросце ад 2,7 да 20,5 гадоў і выпрабавалі дакладнасць кожнай мадэлі. Яны ацанілі развіццё ў агульнай складанасці 16 верхніх і ніжніх левых пастаянных зубоў, выкарыстоўваючы крытэрыі класіфікацыі, прапанаваныя Moorrees et al. MAE складае ад 0,64 да 0,94 года, а RMSE складае ад 0,85 да 1,27 года, якія больш дакладныя, чым дзве мадэлі DM, якія выкарыстоўваюцца ў гэтым даследаванні. Shen et al23 выкарыстаў метад Cameriere для ацэнкі стаматалагічнага ўзросту сямі пастаянных зубоў у левай ніжняй сківіцы ва ўсходняй кітайскай жыхары ва ўзросце ад 5 да 13 гадоў і параўноўваў яго з узростамі, ацэненымі з выкарыстаннем лінейнай рэгрэсіі, SVM і RF. Яны паказалі, што ўсе тры мадэлі DM маюць больш высокую дакладнасць у параўнанні з традыцыйнай формулай Cameriere. MAE і RMSE ў даследаванні Шэна былі ніжэйшыя, чым у мадэлі DM у гэтым даследаванні. Павышаная дакладнасць даследаванняў Сцяпанаўскага і інш. 35 і Шэнь і інш. 23 можа быць звязана з уключэннем малодшых суб'ектаў у свае ўзоры даследавання. Паколькі ўзроставыя ацэнкі для ўдзельнікаў, якія развіваюцца з зубамі, становяцца больш дакладнымі, паколькі колькасць зубоў павялічваецца падчас развіцця стаматалогіі, дакладнасць атрыманага метаду ацэнкі ўзросту можа быць парушана, калі ўдзельнікі даследавання маладзейшыя. Акрамя таго, памылка MLP пры ацэнцы ўзросту крыху меншая, чым SLP, гэта значыць, што MLP больш дакладны, чым SLP. MLP лічыцца крыху лепш для ацэнкі ўзросту, магчыма, з -за схаваных слаёў у MLP38. Аднак ёсць выключэнне для знешняга ўзору жанчын (SLP 1,45, MLP 1,49). Выснова, што MLP больш дакладная, чым SLP пры ацэнцы ўзросту, патрабуе дадатковых рэтраспектыўных даследаванняў.
Таксама параўноўваліся прадукцыйнасць класіфікацыі мадэлі DM і традыцыйны метад на 18-гадовым парозе. Усе правераныя мадэлі SD і традыцыйныя метады ўнутранага тэставага набору паказалі практычна прымальны ўзровень дыскрымінацыі для 18-гадовага ўзору. Адчувальнасць для мужчын і жанчын была больш за 87,7% і 94,9% адпаведна, і спецыфічнасць была больш за 89,3% і 84,7%. AUROC усіх выпрабаваных мадэляў таксама перавышае 0,925. Наколькі нам вядома, ні адно даследаванне не правярала прадукцыйнасць мадэлі DM для 18-гадовай класіфікацыі на аснове сталасці зубоў. Мы можам параўнаць вынікі гэтага даследавання з класіфікацыяй мадэляў глыбокага навучання на панарамных рэнтгенаграмах. Guo et al.15 разлічыў класіфікацыйныя паказчыкі мадэлі глыбокага навучання на аснове CNN і ручнога метаду, заснаванага на метадзе Demirjian для пэўнага ўзроставага парога. Адчувальнасць і спецыфічнасць ручнога метаду склалі 87,7% і 95,5% адпаведна, а адчувальнасць і спецыфічнасць мадэлі CNN перавысілі 89,2% і 86,6% адпаведна. Яны прыйшлі да высновы, што мадэлі глыбокага навучання могуць замяніць або пераўзысці ўручную ацэнку ў класіфікацыі ўзроставых парогаў. Вынікі гэтага даследавання паказалі аналагічныя характарыстыкі класіфікацыі; Лічыцца, што класіфікацыя з выкарыстаннем мадэляў DM можа замяніць традыцыйныя статыстычныя метады для ацэнкі ўзросту. Сярод мадэляў DM LR была лепшай мадэллю ў плане адчувальнасці да мужчынскага ўзору і адчувальнасці і спецыфічнасці для жаночага ўзору. LR займае другое месца па спецыфіцы для мужчын. Больш за тое, LR лічыцца адной з самых зручных мадэляў DM35 і менш складаная і складаная ў апрацоўцы. Зыходзячы з гэтых вынікаў, LR лічылася лепшай мадэллю класіфікацыі адсячэння для 18-гадовага ўзросту ў карэйскім насельніцтве.
У цэлым, дакладнасць ацэнкі ўзросту або прадукцыйнасці класіфікацыі на знешнім тэставым наборы была дрэннай або ніжэйшай у параўнанні з вынікамі ўнутранага тэставага набору. Некаторыя справаздачы паказваюць, што дакладнасць класіфікацыі або эфектыўнасць памяншаецца, калі ўзроставыя ацэнкі на аснове насельніцтва Карэі прымяняюцца да японскага насельніцтва5 39, і падобная схема была знойдзена ў гэтым даследаванні. Гэтая тэндэнцыя пагаршэння таксама назіралася ў мадэлі DM. Таму, каб дакладна ацаніць узрост, нават пры выкарыстанні DM у працэсе аналізу, метады, атрыманыя з дадзеных пра родную папуляцыю, такіх як традыцыйныя метады, павінны аддаць перавагу 5,39,40,41,42. Паколькі незразумела, ці могуць мадэлі глыбокага навучання паказваць падобныя тэндэнцыі, даследаванні, якія параўноўваюць дакладнасць класіфікацыі і эфектыўнасць з выкарыстаннем традыцыйных метадаў, мадэляў DM і глыбокіх мадэляў навучання на тых жа ўзорах, каб пацвердзіць, ці можа штучны інтэлект пераадолець гэтыя расавыя адрозненні ў абмежаваным узросце. Ацэнкі.
Мы дэманструем, што традыцыйныя метады могуць быць заменены на ацэнку ўзросту на аснове мадэлі DM у практыцы судовай ацэнкі ўзросту ў Карэі. Мы таксама выявілі магчымасць рэалізацыі машыннага навучання для судова -медыцынскай ацэнкі. Аднак існуюць відавочныя абмежаванні, такія як недастатковая колькасць удзельнікаў гэтага даследавання, каб канчаткова вызначыць вынікі і адсутнасць папярэдніх даследаванняў для параўнання і пацверджання вынікаў гэтага даследавання. У далейшым даследаванні DM павінны праводзіцца з большай колькасцю узораў і больш разнастайным насельніцтвам, каб палепшыць яго практычную прыдатнасць у параўнанні з традыцыйнымі метадамі. Для праверкі мэтазгоднасці выкарыстання штучнага інтэлекту для ацэнкі ўзросту ў некалькіх папуляцыях неабходныя будучыя даследаванні для параўнання дакладнасці класіфікацыі і эфектыўнасці мадэляў DM і глыбокага навучання з традыцыйнымі метадамі ў тых жа пробах.
У даследаванні было выкарыстана 2657 артаграфічных фатаграфій, сабраных з карэйскіх і японскіх дарослых ва ўзросце ад 15 да 23 гадоў. Карэйскія рэнтгенаграмы былі падзелены на 900 навучальных набораў (19,42 ± 2,65 года) і 900 унутраных тэставых набораў (19,52 ± 2,59 года). Набор трэніровак быў сабраны ў адной установе (бальніца Сеула Сэнт -Мэры), а ўласны тэставы набор быў сабраны ў двух установах (стаматалагічная бальніца Нацыянальнага універсітэта Сеула і стаматалагічная бальніца Yonsei). Мы таксама сабралі 857 рэнтгенаграмаў з іншых дадзеных, заснаваных на насельніцтва (Медыцынскі універсітэт Iwate, Японія) для знешняга тэсціравання. У якасці знешняга тэставага набору былі абраны рэнтгенаграмы японскіх суб'ектаў (19,31 ± 2,60 года). Дадзеныя былі сабраны рэтраспектыўна для аналізу этапаў развіцця зубоў на панарамных рэнтгенаграмах, якія прымаюцца падчас стаматалагічнага лячэння. Усе сабраныя дадзеныя былі ананімнымі, за выключэннем полу, даты нараджэння і даты рэнтгенаграмы. Крытэрыі ўключэння і выключэння былі такімі ж, як і раней апублікаваныя даследаванні 4, 5. Фактычны ўзрост узору разлічваўся, аднімаючы дату нараджэння з даты рэнтгенаграмы. Узорная група была падзелена на дзевяць узроставых груп. Узроставыя і палавыя размеркаванні прыведзены ў табліцы 3. Гэта даследаванне было праведзена ў адпаведнасці з Дэкларацыяй Хельсінкі і зацверджана Інстытуцыйным саветам па аглядзе (IRB) бальніцы Сэнт -Сэнт -Марыі Карэі (KC22WISI0328). З -за рэтраспектыўнай канструкцыі гэтага даследавання, інфармаванае згоду не можа быць атрымана ад усіх пацыентаў, якія праходзяць рэнтгеналагічны агляд у тэрапеўтычных мэтах. Універсітэт Карэі ў Карэі бальніца Святой Марыі (IRB) адмовілася ад патрабавання інфармаванай згоды.
Этапы развіцця бімаксілярных другой і трэціх карэнных карэнных сродкаў ацэньваліся ў адпаведнасці з крытэрыямі Demircan25. Быў абраны толькі адзін зуб, калі адзін і той жа тып зуба быў знойдзены злева і правай бакі кожнай сківіцы. Калі гамалагічныя зубы з абодвух бакоў былі на розных этапах развіцця, зуб з меншай стадыяй развіцця быў абраны для ўліку нявызначанасці ў разліковым узросце. Сто выпадкова адабраных рэнтгенаграфаў з навучальнага набору былі набраны двума вопытнымі назіральнікамі для праверкі надзейнасці Interobserver пасля папярэдняй каліброўкі для вызначэння стадыі сталасці зубоў. Надзейнасць intraobserver была ацэнена двойчы праз тры месяцы інтэрвалаў першасным назіральнікам.
Этап полу і развіцця другой і трэціх карэнных зубоў у навучальным наборы ацэньваўся першасным назіральнікам, падрыхтаваным да розных мадэляў DM, і фактычны ўзрост быў усталяваны ў якасці мэтавага значэння. Мадэлі SLP і MLP, якія шырока выкарыстоўваюцца ў машынным навучанні, былі правераны ў адпаведнасці з алгарытмамі рэгрэсіі. Мадэль DM спалучае ў сабе лінейныя функцыі, выкарыстоўваючы этапы развіцця чатырох зубоў і аб'ядноўвае гэтыя дадзеныя для ацэнкі ўзросту. SLP - самая простая нейронная сетка і не ўтрымлівае схаваных слаёў. SLP працуе на аснове парогавай перадачы паміж вузламі. Мадэль SLP ў рэгрэсіі матэматычна падобная на некалькі лінейных рэгрэсіі. У адрозненне ад мадэлі SLP, мадэль MLP мае некалькі схаваных слаёў з нелінейнай функцыяй актывацыі. У нашых эксперыментах выкарыстоўваўся схаваны пласт толькі з 20 схаванымі вузламі з нелінейнай функцыяй актывацыі. Выкарыстоўвайце градыентны спуск у якасці метаду аптымізацыі і MAE і RMSE як функцыю страты для навучання нашай мадэлі машыннага навучання. Лепшая атрыманая рэгрэсійная мадэль была ўжыта да ўнутраных і знешніх выпрабавальных набораў, а ўзрост зубоў ацэньваўся.
Быў распрацаваны алгарытм класіфікацыі, які выкарыстоўвае сталасць чатырох зубоў на навучальным наборы, каб прадказаць, ці ёсць узор 18 гадоў ці не. Каб пабудаваць мадэль, мы атрымалі сем алгарытмаў машыннага навучання 6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST і (7) MLP MLP . LR - адзін з найбольш шырока выкарыстоўваных алгарытмаў класіфікацыі44. Гэта кантрольны алгарытм навучання, які выкарыстоўвае рэгрэсію для прагназавання верагоднасці дадзеных, якія належаць да пэўнай катэгорыі ад 0 да 1, і класіфікуе дадзеныя як прыналежнасць да больш верагоднай катэгорыі на аснове гэтай верагоднасці; у асноўным выкарыстоўваецца для бінарнай класіфікацыі. KNN - адзін з самых простых алгарытмаў машыннага навучання45. Калі яны прадастаўляюцца новыя ўваходныя дадзеныя, ён знаходзіць дадзеныя K, блізкімі да існуючага набору, а потым класіфікуе іх у клас з самай высокай частатой. Мы ўсталявалі 3 для колькасці разгледжаных суседзяў (k). SVM-гэта алгарытм, які максімальна павялічвае адлегласць паміж двума класамі, выкарыстоўваючы функцыю ядра для пашырэння лінейнай прасторы ў нелінейную прастору пад назвай Fields46. Для гэтай мадэлі мы выкарыстоўваем зрушэнне = 1, магутнасць = 1 і Gamma = 1 як гіперпараметры для ядра мнагачлена. DT прымяняецца ў розных галінах у якасці алгарытму для падзелу цэлых дадзеных на некалькі падгруп, прадстаўляючы правілы рашэння ў структуры дрэва47. Мадэль наладжана з мінімальнай колькасцю запісаў на вузел 2 і выкарыстоўвае індэкс Gini ў якасці меры якасці. РФ - гэта метад ансамбля, які спалучае ў сабе некалькі DT для павышэння прадукцыйнасці з выкарыстаннем метаду агрэгацыі загрузкі, які стварае слабы класіфікатар для кожнага ўзору, выпадкова малюючы ўзоры таго ж памеру некалькі разоў з першапачатковага DataSet48. Мы выкарыстоўвалі 100 дрэў, 10 глыбінь дрэў, 1 мінімальны памер вузла і індэкс прымешкі Джыні ў якасці крытэрыяў падзелу вузла. Класіфікацыя новых дадзеных вызначаецца большасцю галасоў. XGBOOST - гэта алгарытм, які спалучае ў сабе метады павышэння пры дапамозе метаду, які прымае ў якасці дадзеных пра навучанне памылку паміж фактычнымі і прагназаванымі значэннямі папярэдняй мадэлі і павялічвае памылку з выкарыстаннем Gradients49. Гэта шырока выкарыстоўваецца алгарытм з -за яго добрай прадукцыйнасці і эфектыўнасці рэсурсаў, а таксама высокай надзейнасці як функцыі карэкціроўкі пералічанай. Мадэль абсталявана 400 апорнымі коламі. MLP - гэта нейронная сетка, у якой адна або некалькі ўспрымання ўтвараюць некалькі слаёў з адным або некалькімі схаванымі пластамі паміж пластамі ўваходу і вываду38. Выкарыстоўваючы гэта, вы можаце выконваць нелінейную класіфікацыю, калі пры даданні ўваходнага ўзроўню і атрымання значэння вынікаў, прагназаванае значэнне вынікаў параўноўваецца з фактычным значэннем вынікаў, і памылка распаўсюджваецца назад. Мы стварылі схаваны пласт з 20 схаванымі нейронамі ў кожным пласце. Кожная мадэль, якую мы распрацавалі, прымянялася да ўнутраных і знешніх набораў для праверкі класіфікацыі, вылічыўшы адчувальнасць, спецыфічнасць, PPV, NPV і AUROC. Адчувальнасць вызначаецца як суадносіны ўзору, паводле ацэнак, ва ўзросце да 18 гадоў і старэй да ўзору, які, паводле ацэнак, ва ўзросце да 18 гадоў і старэй. Спецыфіка - гэта доля ўзораў, якія не дасягнулі 18 гадоў, і, паводле ацэнак, старэйшыя за 18 гадоў.
Стаматалагічныя стадыі, ацэненыя ў навучальным наборы, былі ператвораны ў лікавыя этапы для статыстычнага аналізу. Шматмерная лінейная і лагістычная рэгрэсія была праведзена для распрацоўкі прагнастычных мадэляў для кожнага полу і атрымання рэгрэсійных формул, якія можна выкарыстоўваць для ацэнкі ўзросту. Мы выкарыстоўвалі гэтыя формулы для ацэнкі ўзросту зуба як для ўнутраных, так і для знешніх тэставых набораў. У табліцы 4 прыведзены мадэлі рэгрэсіі і класіфікацыі, якія выкарыстоўваюцца ў гэтым даследаванні.
Надзейнасць унутры- і інтэрабасарвер была разлічана з выкарыстаннем статыстыкі Kappa Copa. Для праверкі дакладнасці DM і традыцыйных рэгрэсійных мадэляў мы разлічылі MAE і RMSE, выкарыстоўваючы разліковыя і фактычныя ўзросты ўнутраных і знешніх тэставых набораў. Гэтыя памылкі звычайна выкарыстоўваюцца для ацэнкі дакладнасці мадэльных прагнозаў. Чым меншая памылка, тым вышэй дакладнасць прагнозу24. Параўнайце MAE і RMSE ўнутраных і знешніх тэставых набораў, разлічаных з выкарыстаннем DM і традыцыйнай рэгрэсіі. Прадукцыйнасць класіфікацыі 18-гадовага адсячэння ў традыцыйнай статыстыцы ацэньвалася з выкарыстаннем табліцы па надзвычайных сітуацыях 2 × 2. Разлічаная адчувальнасць, спецыфічнасць, PPV, NPV і AUROC тэставага набору параўноўваюцца з вымеранымі значэннямі мадэлі класіфікацыі DM. Дадзеныя выражаюцца як сярэдняе ± стандартнае адхіленне або колькасць (%) у залежнасці ад характарыстык дадзеных. Двухбаковыя значэнні Р <0,05 лічыліся статыстычна значнымі. Усе звычайныя статыстычныя аналізы праводзіліся з выкарыстаннем SAS версіі 9.4 (Інстытут SAS, Cary, NC). Мадэль рэгрэсіі DM была рэалізавана ў Python з выкарыстаннем Keras50 2.2.4 Backend і TensorFlow51 1.8.0 спецыяльна для матэматычных аперацый. Мадэль класіфікацыі DM была рэалізавана ў асяроддзі аналізу ведаў Waikato і платформе Analyss Constanz Information (KNIME) 4.6.152.
Аўтары прызнаюць, што дадзеныя, якія падтрымліваюць высновы даследавання, можна знайсці ў артыкуле і дадатковых матэрыялах. Згенераваныя і/або прааналізаваныя наборы дадзеных падчас даследавання даступныя ў адпаведнага аўтара па разумным запыце.
Ritz-Timme, S. et al. Узроставая ацэнка: сучаснае мастацтва для задавальнення канкрэтных патрабаванняў судовай практыкі. міжнароднасць. J. Legal Medicine. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., and Olze, A. Сучасны статус судова -медыцынскай ацэнкі жывых прадметаў для мэт крымінальнага пераследу. Судова -экспертыза. лекі. Паталогія. 1, 239–246 (2005).
Pan, J. et al. Мадыфікаваны метад ацэнкі стаматалагічнага ўзросту дзяцей ва ўзросце ад 5 да 16 гадоў ва ўсходнім Кітаі. Клінічны. Вуснае абследаванне. 25, 3463–3474 (2021).
Лі, СС і г.д. Храналогія развіцця другой і трэцяй карэньчыкаў у карэйцаў і яго прымяненне для судовай ацэнкі ўзросту. міжнароднасць. J. Legal Medicine. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY і Lee, SS дакладнасць ацэнкі ўзросту і ацэнка 18-гадовага парога на аснове сталасці другога і трэцяга карэньчыкаў у карэйцаў і японцаў. PLOS One 17, E0271247 (2022).
Кім, Джы і інш. Аналіз дадзеных на аснове перадаперацыйнага машыннага навучання можа прадказаць вынікі лячэння аперацыі на сон у пацыентаў з АСА. навука. Справаздача 11, 14911 (2021).
Хан, М. і інш. Дакладная ўзроставая ацэнка ад машыннага навучання з умяшаннем чалавека альбо без іх? міжнароднасць. J. Legal Medicine. 136, 821–831 (2022).
Хан, С. і Шахін, М. Ад майнинга дадзеных да здабычы дадзеных. J.Information. навука. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. and Shaheen, M. Wisrule: Першы кагнітыўны алгарытм для майнинга правілаў асацыяцыі. J.Information. навука. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. and Abdullah U. Karm: Традыцыйнае здабыча дадзеных на аснове правілаў асацыяцыі на аснове кантэксту. вылічыць. Мэт. Працягнуць. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. and Habib M. Deep Learning Semantic Spectionale Designation з выкарыстаннем тэкставых дадзеных. паведаміць. Тэхналогіі. кантроль. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., and Shahin, M. Сістэма прызнання дзейнасці ў спартыўных відэа. Мультымедыя. Прыкладанні інструментаў https://doi.org/10.1007/s11042-021-10519-6 (2021).
Халабі, SS і інш. Задача машыннага навучання RSNA ў дзіцячай косці. Радыялогія 290, 498–503 (2019).
Лі, Ю. і інш. Ацэнка судова-медыцынскай экспертызы ад рэнтгенаўскіх прамянёў таза з выкарыстаннем глыбокага навучання. Еўра. радыяцыя. 29, 2322–2329 (2019).
Го, YC і інш. Дакладная ўзроставая класіфікацыя з выкарыстаннем ручных метадаў і глыбокіх згортвальных нейронных сетак з артаграфічных праекцыйных малюнкаў. міжнароднасць. J. Legal Medicine. 135, 1589–1597 (2021).
Алабама Далора і інш. Ацэнка ўзросту косці з выкарыстаннем розных метадаў машыннага навучання: сістэматычны агляд літаратуры і метааналіз. PLOS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., and Yang, J. Ацэнка ўзросту, характэрнай для насельніцтва афраамерыканцаў і кітайцаў на аснове аб'ёмаў камернай камеры першых карэнных зубоў з выкарыстаннем кампутарнай тамаграфіі. міжнароднасць. J. Legal Medicine. 136, 811–819 (2022).
Кім С., Лі YH, NoH YK, Park FK і OH KS, якія вызначаюць узроставыя групы жывых людзей, якія выкарыстоўваюць выявы першых карэньчыкаў на аснове штучнага інтэлекту. навука. Справаздача 11, 1073 (2021).
Stern, D., Player, C., Giuliani, N., and Urschler, M. Аўтаматычная ацэнка ўзросту і класіфікацыя ўзросту большасці ад шматмерных дадзеных МРТ. IEEE J. BIOMED. Абвесткі пра здароўе. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. and Li, G. Ацэнка ўзросту на аснове 3D -сегментацыі камернай камеры першых карэнных зубоў з камп'ютэрнай тамаграфіі конуснага прамяня шляхам інтэграцыі глыбокага навучання і набораў узроўняў. міжнароднасць. J. Legal Medicine. 135, 365–373 (2021).
Wu, WT, et al. Майнинг дадзеных у клінічных вялікіх дадзеных: агульныя базы дадзеных, крокі і метады. Свет. лекі. рэсурс. 8, 44 (2021).
Ян, Дж. І інш. Уводзіны ў медыцынскія базы дадзеных і тэхналогіі здабычы дадзеных у эпоху вялікіх дадзеных. J. Avid. Асноўная медыцына. 13, 57–69 (2020).
Шэнь, С. і інш. Метад Кэмера для ацэнкі ўзросту зуба з выкарыстаннем машыннага навучання. BMC Health Health 21, 641 (2021).
Галібург А. і інш. Параўнанне розных метадаў машыннага навучання для прагназавання стаматалагічнага ўзросту з выкарыстаннем метаду пастаноўкі Demirdjian. міжнароднасць. J. Legal Medicine. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. and Tanner, JM - Новая сістэма для ацэнкі стаматалагічнага ўзросту. Пумар. Біялогія. 45, 211–227 (1973).
LANDIS, JR і KOCH, GG Меры дамоўленасці назіральнікаў па катэгарычных дадзеных. Біяметрыя 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK і Choi HK. Тэкстурная, марфалагічная і статыстычны аналіз двухмернай магнітна-рэзананснай тамаграфіі з выкарыстаннем метадаў штучнага інтэлекту для дыферэнцыяцыі першасных пухлін мозгу. Інфармацыя пра здароўе. рэсурс. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Час паведамлення: студзень-04-2024