Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Дзякуй за наведванне Nature.com.Версія браўзера, якой вы карыстаецеся, мае абмежаваную падтрымку CSS.Для дасягнення найлепшых вынікаў мы рэкамендуем выкарыстоўваць больш новую версію вашага браўзера (або адключыць рэжым сумяшчальнасці ў Internet Explorer).Тым часам, каб забяспечыць пастаянную падтрымку, мы паказваем сайт без стылізацыі і JavaScript.
Зубы лічацца найбольш дакладным паказчыкам узросту чалавечага цела і часта выкарыстоўваюцца ў судова-медыцынскай ацэнцы ўзросту.Мы імкнуліся праверыць ацэнкі стаматалагічнага ўзросту на аснове інтэлектуальнага аналізу даных шляхам параўнання дакладнасці ацэнкі і эфектыўнасці класіфікацыі 18-гадовага парога з традыцыйнымі метадамі і ацэнкамі ўзросту на аснове інтэлектуальнага аналізу даных.Усяго было сабрана 2657 панарамных рэнтгенаграм ад грамадзян Карэі і Японіі ва ўзросце ад 15 да 23 гадоў.Яны былі падзелены на навучальны набор, кожны з якіх змяшчае 900 карэйскіх рэнтгенаграм, і ўнутраны тэставы набор, які змяшчае 857 японскіх рэнтгенаграм.Мы параўналі дакладнасць класіфікацыі і эфектыўнасць традыцыйных метадаў з тэставымі наборамі мадэляў інтэлектуальнага аналізу дадзеных.Дакладнасць традыцыйнага метаду на ўнутраным тэставым наборы крыху вышэйшая, чым у мадэлі інтэлектуальнага аналізу даных, і розніца невялікая (сярэдняя абсалютная памылка <0,21 года, сярэднеквадратычная памылка <0,24 года).Прадукцыйнасць класіфікацыі для 18-гадовага адсячэння таксама падобная паміж традыцыйнымі метадамі і мадэлямі інтэлектуальнага аналізу дадзеных.Такім чынам, традыцыйныя метады могуць быць заменены мадэлямі інтэлектуальнага аналізу дадзеных пры выкананні судова-медыцынскай ацэнкі ўзросту з выкарыстаннем сталасці другіх і трэціх маляраў у карэйскіх падлеткаў і маладых людзей.
Вызначэнне стаматалагічнага ўзросту шырока выкарыстоўваецца ў судовай медыцыне і дзіцячай стаматалогіі.У прыватнасці, з-за высокай карэляцыі паміж храналагічным узростам і развіццём зубоў ацэнка ўзросту па стадыях развіцця зубоў з'яўляецца важным крытэрыем ацэнкі ўзросту дзяцей і падлеткаў1,2,3.Аднак для маладых людзей ацэнка ўзросту зубоў на аснове сталасці зубоў мае свае абмежаванні, паколькі рост зубоў амаль завершаны, за выключэннем трэціх карэнных зубоў.Юрыдычная мэта вызначэння ўзросту маладых людзей і падлеткаў - прадастаўленне дакладных ацэнак і навуковых доказаў дасягнення імі паўналецця.У медыцынскай і юрыдычнай практыцы падлеткаў і маладых людзей у Карэі ўзрост ацэньваўся з выкарыстаннем метаду Лі, а законны парог у 18 гадоў быў прагназаваны на аснове дадзеных О і інш 5 .
Машыннае навучанне - гэта тып штучнага інтэлекту (AI), які неаднаразова вывучае і класіфікуе вялікія аб'ёмы даных, самастойна вырашае праблемы і кіруе праграмаваннем даных.Машыннае навучанне можа выявіць карысныя схаваныя шаблоны ў вялікіх аб'ёмах даных6.Наадварот, класічныя метады, якія з'яўляюцца працаёмкімі і адымаюць шмат часу, могуць мець абмежаванні пры працы з вялікімі аб'ёмамі складаных даных, якія цяжка апрацаваць уручную7.Такім чынам, у апошні час было праведзена шмат даследаванняў з выкарыстаннем найноўшых камп'ютэрных тэхналогій для мінімізацыі чалавечых памылак і эфектыўнай апрацоўкі шматмерных даных8,9,10,11,12.У прыватнасці, глыбокае навучанне шырока выкарыстоўваецца ў аналізе медыцынскіх малюнкаў, а таксама паведамлялася, што розныя метады ацэнкі ўзросту шляхам аўтаматычнага аналізу рэнтгенаграм паляпшаюць дакладнасць і эфектыўнасць ацэнкі ўзросту13,14,15,16,17,18,19,20 .Напрыклад, Халабі і інш 13 распрацавалі алгарытм машыннага навучання на аснове згортачных нейронавых сетак (CNN) для ацэнкі шкілетнага ўзросту з дапамогай рэнтгенаграм дзіцячых рук.Гэта даследаванне прапануе мадэль, якая прымяняе машыннае навучанне да медыцынскіх малюнкаў і паказвае, што гэтыя метады могуць павысіць дакладнасць дыягностыкі.Li et al14 ацанілі ўзрост па рэнтгенаўскіх здымках органаў малога таза з дапамогай глыбокага навучання CNN і параўналі іх з вынікамі рэгрэсіі з дапамогай ацэнкі стадыі акасцянення.Яны выявілі, што мадэль глыбокага навучання CNN паказала такую ж эфектыўнасць ацэнкі ўзросту, як і традыцыйная мадэль рэгрэсіі.Даследаванне Гуо і інш. [15] ацаніла класіфікацыю ўзроставай талерантнасці тэхналогіі CNN на аснове стаматалагічных артафатаграфій, і вынікі мадэлі CNN даказалі, што людзі пераўзыходзяць узроставую класіфікацыю.
У большасці даследаванняў па ацэнцы ўзросту з дапамогай машыннага навучання выкарыстоўваюцца метады глыбокага навучання13,14,15,16,17,18,19,20.Паведамляецца, што ацэнка ўзросту на аснове глыбокага навучання больш дакладная, чым традыцыйныя метады.Аднак гэты падыход дае мала магчымасцей для прадстаўлення навуковай асновы для ацэнкі ўзросту, напрыклад узроставых паказчыкаў, якія выкарыстоўваюцца ў ацэнках.Таксама існуе судовая спрэчка наконт таго, хто праводзіць праверкі.Такім чынам, ацэнку ўзросту, заснаваную на глыбокім навучанні, цяжка прыняць адміністрацыйным і судовым органам.Інтэлектуальны аналіз дадзеных (DM) - гэта метад, які дазваляе выяўляць не толькі чаканую, але і нечаканую інфармацыю як метад выяўлення карысных карэляцый паміж вялікімі аб'ёмамі даных6,21,22.Машыннае навучанне часта выкарыстоўваецца ў інтэлектуальным аналізе дадзеных, і інтэлектуальны аналіз дадзеных, і машыннае навучанне выкарыстоўваюць адны і тыя ж ключавыя алгарытмы для выяўлення шаблонаў у дадзеных.Ацэнка ўзросту з дапамогай стаматалагічнага развіцця заснавана на ацэнцы экзаменатарам сталасці мэтавых зубоў, і гэтая ацэнка выяўляецца ў выглядзе стадыі для кожнага мэтавага зуба.DM можа выкарыстоўвацца для аналізу карэляцыі паміж стадыяй стаматалагічнай ацэнкі і фактычным узростам і можа замяніць традыцыйны статыстычны аналіз.Такім чынам, калі мы ўжываем метады DM для ацэнкі ўзросту, мы можам укараніць машыннае навучанне ў судова-медыцынскай ацэнцы ўзросту, не турбуючыся аб юрыдычнай адказнасці.Было апублікавана некалькі параўнальных даследаванняў аб магчымых альтэрнатывах традыцыйным ручным метадам, якія выкарыстоўваюцца ў судова-медыцынскай практыцы, і метадам вызначэння ўзросту зубоў на аснове EBM.Shen et al23 паказалі, што мадэль DM больш дакладная, чым традыцыйная формула Камерэра.Galibourg et al24 прымянілі розныя метады DM для прагназавання ўзросту ў адпаведнасці з крытэрам Дэмірджыяна25, і вынікі паказалі, што метад DM пераўзыходзіў метады Дэмірджыяна і Віллемса ў ацэнцы ўзросту французскага насельніцтва.
Для ацэнкі стаматалагічнага ўзросту карэйскіх падлеткаў і маладых людзей у карэйскай судова-медыцынскай практыцы шырока выкарыстоўваецца метад 4 Лі.Гэты метад выкарыстоўвае традыцыйны статыстычны аналіз (напрыклад, множную рэгрэсію) для вывучэння ўзаемасувязі паміж карэйскімі суб'ектамі і храналагічным узростам.У гэтым даследаванні метады ацэнкі ўзросту, атрыманыя з дапамогай традыцыйных статыстычных метадаў, вызначаюцца як «традыцыйныя метады».Метад Лі з'яўляецца традыцыйным метадам, і яго дакладнасць была пацверджана Oh et al.5;аднак дастасавальнасць ацэнкі ўзросту на аснове мадэлі DM у карэйскай судова-медыцынскай практыцы ўсё яшчэ выклікае сумневы.Наша мэта складалася ў тым, каб навукова пацвердзіць патэнцыйную карыснасць ацэнкі ўзросту на аснове мадэлі DM.Мэтай гэтага даследавання было (1) параўнанне дакладнасці дзвюх мадэляў СД пры ацэнцы стаматалагічнага ўзросту і (2) параўнанне эфектыўнасці класіфікацыі 7 мадэляў СД ва ўзросце 18 гадоў з дадзенымі, атрыманымі з дапамогай традыцыйных статыстычных метадаў. і трэція маляры абедзвюх сківіц.
Сярэднія значэнні і стандартныя адхіленні храналагічнага ўзросту па стадыях і тыпу зубоў паказаны ў Інтэрнэце ў дадатковай табліцы S1 (набор для навучання), дадатковай табліцы S2 (набор унутраных тэстаў) і дадатковай табліцы S3 (набор знешніх тэстаў).Значэнні каппа для надзейнасці ўнутры і паміж назіральнікамі, атрыманыя з навучальнага набору, былі 0,951 і 0,947 адпаведна.Значэнні P і 95% даверныя інтэрвалы для значэнняў капа паказаны ў дадатковай онлайн-табліцы S4.Каппа значэнне было вытлумачана як «амаль ідэальнае», у адпаведнасці з крытэрыямі Ландзіса і Коха26.
Калі параўноўваць сярэднюю абсалютную памылку (MAE), традыцыйны метад нязначна пераўзыходзіць мадэль DM для ўсіх полаў і ў знешнім мужчынскім наборы тэстаў, за выключэннем шматслойнага персептрона (MLP).Розніца паміж традыцыйнай мадэллю і мадэллю DM ва ўнутраным наборы тэстаў MAE складала 0,12–0,19 года для мужчын і 0,17–0,21 года для жанчын.Для батарэі вонкавага тэсту адрозненні менш (0,001–0,05 года для мужчын і 0,05–0,09 года для жанчын).Акрамя таго, сярэднеквадратычная памылка (RMSE) крыху ніжэйшая, чым у традыцыйнага метаду, з меншымі адрозненнямі (0,17–0,24, 0,2–0,24 для мужчынскага ўнутранага тэсту і 0,03–0,07, 0,04–0,08 для вонкавага тэсту).).MLP паказвае крыху лепшую прадукцыйнасць, чым Single Layer Perceptron (SLP), за выключэннем выпадку вонкавага набору жаночых тэстаў.Для MAE і RMSE набор знешніх тэстаў мае больш высокія балы, чым набор унутраных тэстаў для ўсіх полаў і мадэляў.Усе MAE і RMSE паказаны ў табліцы 1 і на малюнку 1.
MAE і RMSE традыцыйных і рэгрэсійных мадэляў інтэлектуальнага аналізу дадзеных.Сярэдняя абсалютная памылка MAE, сярэднеквадратычная памылка RMSE, аднаслаёвы персептрон SLP, шматслаёвы персептрон MLP, традыцыйны метад CM.
Прадукцыйнасць класіфікацыі (з адсечкай у 18 гадоў) традыцыйнай мадэлі і мадэляў DM была прадэманстравана з пункту гледжання адчувальнасці, спецыфічнасці, станоўчай прагнастычнай каштоўнасці (PPV), адмоўнай прагнастычнай каштоўнасці (NPV) і плошчы пад крывой працоўнай характарыстыкі прымача (AUROC). 27 (табліца 2, малюнак 2 і дадатковы малюнак 1 у Інтэрнэце).Што тычыцца адчувальнасці ўнутранай тэставай батарэі, традыцыйныя метады паказалі лепшыя вынікі сярод мужчын і горш сярод жанчын.Аднак розніца ў эфектыўнасці класіфікацыі паміж традыцыйнымі метадамі і SD складае 9,7% для мужчын (MLP) і толькі 2,4% для жанчын (XGBoost).Сярод мадэляў DM лагістычная рэгрэсія (LR) паказала лепшую адчувальнасць у абодвух полаў.Што тычыцца спецыфікі ўнутранага тэставага набору, было заўважана, што чатыры мадэлі SD паказалі сябе добра ў мужчын, у той час як традыцыйная мадэль - у жанчын.Адрозненні ў эфектыўнасці класіфікацыі для мужчын і жанчын складаюць 13,3% (MLP) і 13,1% (MLP), адпаведна, што сведчыць аб тым, што розніца ў эфектыўнасці класіфікацыі паміж мадэлямі перавышае адчувальнасць.Сярод мадэляў DM мадэлі апорнага вектара (SVM), дрэва рашэнняў (DT) і выпадковага лесу (RF) паказалі лепшыя вынікі сярод мужчын, а мадэль LR - сярод жанчын.Каэфіцыент AUROC традыцыйнай мадэлі і ўсіх мадэляў SD быў большы за 0,925 (k-бліжэйшы сусед (KNN) у мужчын), што дэманструе выдатную класіфікацыйную прадукцыйнасць у выбарцы 18-гадовых 28.Для вонкавага набору тэстаў назіралася зніжэнне эфектыўнасці класіфікацыі з пункту гледжання адчувальнасці, спецыфічнасці і AUROC у параўнанні з унутраным наборам тэстаў.Больш за тое, розніца ў адчувальнасці і спецыфічнасці паміж паказчыкамі класіфікацыі лепшай і горшай мадэляў вагалася ад 10% да 25% і была большай, чым розніца ва ўнутраным наборы тэстаў.
Адчувальнасць і спецыфічнасць мадэляў класіфікацыі інтэлектуальнага аналізу дадзеных у параўнанні з традыцыйнымі метадамі з адсечкай 18 гадоў.KNN k бліжэйшага суседа, вектарная машына падтрымкі SVM, лагістычная рэгрэсія LR, дрэва рашэнняў DT, радыёчастотны выпадковы лес, XGB XGBoost, шматслаёвы персептрон MLP, традыцыйны метад CM.
Першым крокам у гэтым даследаванні было параўнанне дакладнасці ацэнак стаматалагічнага ўзросту, атрыманых з сямі мадэляў DM, з ацэнкамі, атрыманымі з дапамогай традыцыйнай рэгрэсіі.MAE і RMSE ацэньваліся ва ўнутраных наборах тэстаў для абодвух полаў, і розніца паміж традыцыйным метадам і мадэллю DM вагалася ад 44 да 77 дзён для MAE і ад 62 да 88 дзён для RMSE.Хоць традыцыйны метад быў крыху больш дакладным у гэтым даследаванні, цяжка зрабіць выснову, ці мае такое невялікае адрозненне клінічнае або практычнае значэнне.Гэтыя вынікі паказваюць, што дакладнасць ацэнкі стаматалагічнага ўзросту з дапамогай мадэлі DM практычна такая ж, як і традыцыйнага метаду.Прамое параўнанне з вынікамі папярэдніх даследаванняў складана, таму што ні ў адным даследаванні не параўноўвалася дакладнасць мадэляў DM з традыцыйнымі статыстычнымі метадамі з выкарыстаннем той жа тэхнікі запісу зубоў у тым жа ўзроставым дыяпазоне, што і ў гэтым даследаванні.Galibourg et al24 параўноўвалі MAE і RMSE паміж двума традыцыйнымі метадамі (метад Дэмірдж'яна25 і метад Willems29) і 10 мадэлямі СД у французскай папуляцыі ва ўзросце ад 2 да 24 гадоў.Яны паведамілі, што ўсе мадэлі DM былі больш дакладнымі, чым традыцыйныя метады, з адрозненнямі ў 0,20 і 0,38 года ў MAE і 0,25 і 0,47 года ў RMSE у параўнанні з метадамі Віллемса і Дэмірджыяна адпаведна.Неадпаведнасць паміж мадэллю SD і традыцыйнымі метадамі, паказанымі ў даследаванні Галібурга, улічвае шматлікія паведамленні30,31,32,33 аб тым, што метад Дэмірджыяна не дазваляе дакладна ацаніць узрост зубоў у іншых папуляцыях, акрамя французскіх канадцаў, на якіх грунтавалася даследаванне.у гэтым даследаванні.Tai et al 34 выкарыстоўвалі алгарытм MLP для прагназавання ўзросту зубоў па 1636 кітайскіх артадантычных фотаздымках і параўналі яго дакладнасць з вынікамі метаду Дэмірдж'яна і Віллемса.Яны паведамілі, што MLP мае больш высокую дакладнасць, чым традыцыйныя метады.Розніца паміж метадам Дэмірджыяна і традыцыйным метадам складае <0,32 года, а метадам Віллемса - 0,28 года, што падобна да вынікаў гэтага даследавання.Вынікі гэтых папярэдніх даследаванняў24,34 таксама супадаюць з вынікамі гэтага даследавання, а дакладнасць ацэнкі ўзросту мадэлі СД і традыцыйнага метаду падобныя.Аднак, грунтуючыся на прадстаўленых выніках, мы можам толькі асцярожна зрабіць выснову, што выкарыстанне мадэляў DM для ацэнкі ўзросту можа замяніць існуючыя метады з-за адсутнасці параўнальных і эталонных папярэдніх даследаванняў.Для пацверджання вынікаў, атрыманых у гэтым даследаванні, неабходныя наступныя даследаванні з выкарыстаннем вялікіх узораў.
Сярод даследаванняў, у якіх правяралася дакладнасць SD пры ацэнцы ўзросту зубоў, некаторыя паказалі больш высокую дакладнасць, чым наша даследаванне.Stepanovsky et al.35 прымянілі 22 мадэлі SD да панарамных рэнтгенаграм 976 жыхароў Чэхіі ва ўзросце ад 2,7 да 20,5 гадоў і праверылі дакладнасць кожнай мадэлі.Яны ацанілі развіццё ў агульнай складанасці 16 верхніх і ніжніх левых пастаянных зубоў, выкарыстоўваючы крытэрыі класіфікацыі, прапанаваныя Moorrees et al.36.MAE вагаецца ад 0,64 да 0,94 года, а RMSE - ад 0,85 да 1,27 года, што з'яўляецца больш дакладным, чым дзве мадэлі DM, выкарыстаныя ў гэтым даследаванні.Shen et al23 выкарыстоўвалі метад Cameriere для ацэнкі стаматалагічнага ўзросту сямі пастаянных зубоў левай ніжняй сківіцы ў жыхароў усходняга Кітая ва ўзросце ад 5 да 13 гадоў і параўналі яго з узростам, ацэненым з дапамогай лінейнай рэгрэсіі, SVM і RF.Яны паказалі, што ўсе тры мадэлі DM маюць больш высокую дакладнасць у параўнанні з традыцыйнай формулай Cameriere.MAE і RMSE у даследаванні Шэна былі ніжэй, чым у мадэлі DM у гэтым даследаванні.Падвышаная дакладнасць даследаванняў Степановского і соавт.35 і Шэнь і інш.23 можа быць звязана з уключэннем малодшых суб'ектаў у выбаркі іх даследавання.Паколькі ацэнкі ўзросту ўдзельнікаў з развіццём зубоў становяцца больш дакладнымі па меры павелічэння колькасці зубоў падчас стаматалагічнага развіцця, дакладнасць выніковага метаду ацэнкі ўзросту можа быць парушана, калі ўдзельнікі даследавання маладзейшыя.Акрамя таго, памылка MLP у ацэнцы ўзросту крыху меншая, чым памылка SLP, што азначае, што MLP больш дакладны, чым SLP.MLP лічыцца крыху лепшым для ацэнкі ўзросту, магчыма, з-за схаваных слаёў у MLP38.Аднак ёсць выключэнне для вонкавай выбаркі жанчын (SLP 1,45, MLP 1,49).Выснова таго, што MLP больш дакладны, чым SLP, у ацэнцы ўзросту патрабуе дадатковых рэтраспектыўных даследаванняў.
Таксама параўноўвалася эфектыўнасць класіфікацыі мадэлі DM і традыцыйнага метаду на парозе 18 гадоў.Усе правераныя мадэлі SD і традыцыйныя метады на ўнутраным наборы тэстаў паказалі практычна прымальны ўзровень дыскрымінацыі для 18-гадовай выбаркі.Адчувальнасць для мужчын і жанчын была вышэй за 87,7% і 94,9% адпаведна, а спецыфічнасць - больш за 89,3% і 84,7%.AUROC ўсіх пратэставаных мадэляў таксама перавышае 0,925.Наколькі нам вядома, ні адно даследаванне не правярала прадукцыйнасць мадэлі DM для 18-гадовай класіфікацыі на аснове сталасці зубоў.Мы можам параўнаць вынікі гэтага даследавання з эфектыўнасцю класіфікацыі мадэляў глыбокага навучання на панарамных рэнтгенаграмах.Guo et al.15 разлічылі эфектыўнасць класіфікацыі мадэлі глыбокага навучання на аснове CNN і ручнога метаду, заснаванага на метадзе Дэмірдж'яна для пэўнага ўзроставага парога.Адчувальнасць і спецыфічнасць ручнога метаду склалі 87,7% і 95,5% адпаведна, а адчувальнасць і спецыфічнасць мадэлі CNN перавышалі 89,2% і 86,6% адпаведна.Яны прыйшлі да высновы, што мадэлі глыбокага навучання могуць замяніць або пераўзыходзіць ручную ацэнку ў класіфікацыі ўзроставых парогаў.Вынікі гэтага даследавання паказалі аналагічную прадукцыйнасць класіфікацыі;Лічыцца, што класіфікацыя з выкарыстаннем мадэляў DM можа замяніць традыцыйныя статыстычныя метады ацэнкі ўзросту.Сярод мадэляў DM LR была лепшай мадэллю з пункту гледжання адчувальнасці для выбаркі мужчын і адчувальнасці і спецыфічнасці для выбаркі жанчыны.LR займае другое месца па спецыфічнасці для мужчын.Больш за тое, LR лічыцца адной з найбольш зручных мадэляў DM35 і менш складаная і складаная ў апрацоўцы.Грунтуючыся на гэтых выніках, LR лічылася найлепшай мадэллю класіфікацыі гранічнага ўзроўню для 18-гадовых сярод карэйскага насельніцтва.
У цэлым, дакладнасць ацэнкі ўзросту або класіфікацыі на вонкавым наборы тэстаў была нізкай або ніжэйшай у параўнанні з вынікамі ўнутранага тэсту.Некаторыя справаздачы паказваюць, што дакладнасць або эфектыўнасць класіфікацыі зніжаецца, калі ацэнкі ўзросту, заснаваныя на карэйскай папуляцыі, прымяняюцца да японскай папуляцыі5,39, і падобная карціна была выяўлена ў дадзеным даследаванні.Гэтая тэндэнцыя да пагаршэння таксама назіралася ў мадэлі DM.Такім чынам, для дакладнай ацэнкі ўзросту, нават пры выкарыстанні DM у працэсе аналізу, варта аддаваць перавагу метадам, атрыманым з дадзеных мясцовага насельніцтва, такім як традыцыйныя метады5,39,40,41,42.Паколькі незразумела, ці могуць мадэлі глыбокага навучання паказваць падобныя тэндэнцыі, неабходныя даследаванні, якія параўноўваюць дакладнасць і эфектыўнасць класіфікацыі з выкарыстаннем традыцыйных метадаў, мадэляў DM і мадэляў глыбокага навучання на адных і тых жа ўзорах, каб пацвердзіць, ці можа штучны інтэлект пераадолець гэтыя расавыя дыспрапорцыі ў абмежаваным узросце.ацэнкі.
Мы дэманструем, што традыцыйныя метады могуць быць заменены ацэнкай узросту на аснове мадэлі DM у судова-медыцынскай практыцы ацэнкі ўзросту ў Карэі.Мы таксама выявілі магчымасць укаранення машыннага навучання для судова-медыцынскай ацэнкі ўзросту.Аднак існуюць відавочныя абмежаванні, такія як недастатковая колькасць удзельнікаў гэтага даследавання для канчатковага вызначэння вынікаў і адсутнасць папярэдніх даследаванняў для параўнання і пацверджання вынікаў гэтага даследавання.У будучыні даследаванні DM павінны праводзіцца з большай колькасцю ўзораў і больш разнастайнымі папуляцыямі, каб палепшыць яго практычную прымянімасць у параўнанні з традыцыйнымі метадамі.Каб пацвердзіць магчымасць выкарыстання штучнага інтэлекту для ацэнкі ўзросту ў некалькіх папуляцыях, неабходныя будучыя даследаванні для параўнання дакладнасці класіфікацыі і эфектыўнасці мадэляў DM і глыбокага навучання з традыцыйнымі метадамі ў тых жа выбарках.
У даследаванні выкарыстоўваліся 2657 арфаграфічных фатаграфій, сабраных у дарослых карэйцаў і японцаў ва ўзросце ад 15 да 23 гадоў.Карэйскія рэнтгенаграмы былі падзелены на 900 трэніровачных набораў (19,42 ± 2,65 года) і 900 унутраных тэставых набораў (19,52 ± 2,59 года).Навучальны набор быў сабраны ў адной установе (Сеульская бальніца Святой Марыі), а ўласны тэставы набор быў сабраны ў двух установах (Стаматалагічная бальніца Сеульскага нацыянальнага універсітэта і Стаматалагічная бальніца Універсітэта Ёнсэй).Мы таксама сабралі 857 рэнтгенаграм з іншых папуляцыйных дадзеных (Медыцынскі універсітэт Іватэ, Японія) для вонкавага тэставання.Рэнтгенаграмы японскіх суб'ектаў (19,31 ± 2,60 гадоў) былі выбраны ў якасці вонкавага тэсту.Дадзеныя былі сабраны рэтраспектыўна для аналізу этапаў развіцця зубоў на панарамных рэнтгенаграмах, зробленых падчас лячэння зубоў.Усе сабраныя дадзеныя былі ананімнымі, за выключэннем полу, даты нараджэння і даты рэнтгенаграмы.Крытэрыі ўключэння і выключэння былі такімі ж, як і ў раней апублікаваных даследаваннях 4, 5.Фактычны ўзрост узору быў разлічаны шляхам аднімання даты нараджэння з даты, калі была зроблена рэнтгенаграма.Выбарка была падзелена на дзевяць узроставых груп.Размеркаванне па ўзросце і полу паказана ў табліцы 3. Гэта даследаванне было праведзена ў адпаведнасці з Хельсінкскай дэкларацыяй і зацверджана Інстытуцыйным назіральным саветам (IRB) Сеульскага шпіталя Святой Марыі Каталіцкага ўніверсітэта Карэі (KC22WISI0328).З-за рэтраспектыўнага дызайну гэтага даследавання інфармаваную згоду нельга было атрымаць ад усіх пацыентаў, якія праходзяць рэнтгенаграфічнае даследаванне ў тэрапеўтычных мэтах.Шпіталь Святой Марыі Сеульскага карэйскага універсітэта (IRB) адмовіўся ад патрабавання інфармаванай згоды.
Стадыі развіцця другіх і трэціх карэнных зубоў двучелюстной косткі ацэньвалі ў адпаведнасці з крытэрыямі Дэміркана25.Быў абраны толькі адзін зуб, калі той жа тып зуба быў знойдзены з левага і правага бакоў кожнай сківіцы.Калі гамалагічныя зубы з абодвух бакоў знаходзіліся на розных стадыях развіцця, выбіраўся зуб з больш нізкай стадыяй развіцця, каб улічыць нявызначанасць меркаванага ўзросту.Сто выпадкова выбраных рэнтгенаграм з навучальнага набору былі ацэнены двума вопытнымі назіральнікамі для праверкі надзейнасці паміж назіральнікамі пасля папярэдняй каліброўкі для вызначэння стадыі сталасці зубоў.Надзейнасць унутры назіральніка ацэньвалася двойчы з інтэрвалам у тры месяцы асноўным назіральнікам.
Пол і стадыя развіцця другіх і трэціх маляраў кожнай сківіцы ў навучальным наборы былі ацэненыя асноўным назіральнікам, навучаным з рознымі мадэлямі DM, і фактычны ўзрост быў усталяваны ў якасці мэтавага значэння.Мадэлі SLP і MLP, якія шырока выкарыстоўваюцца ў машынным навучанні, былі пратэставаны на алгарытмы рэгрэсіі.Мадэль DM аб'ядноўвае лінейныя функцыі з выкарыстаннем стадый развіцця чатырох зубоў і аб'ядноўвае гэтыя дадзеныя для ацэнкі ўзросту.SLP з'яўляецца найпростай нейронавай сеткай і не ўтрымлівае схаваных слаёў.SLP працуе на аснове парогавай перадачы паміж вузламі.Мадэль SLP у рэгрэсіі матэматычна падобная да множнай лінейнай рэгрэсіі.У адрозненне ад мадэлі SLP, мадэль MLP мае некалькі схаваных слаёў з функцыямі нелінейнай актывацыі.У нашых эксперыментах выкарыстоўваўся схаваны пласт толькі з 20 схаванымі вузламі з нелінейнымі функцыямі актывацыі.Выкарыстоўвайце градыентны спуск у якасці метаду аптымізацыі і MAE і RMSE у якасці функцыі страт для навучання нашай мадэлі машыннага навучання.Найлепшая атрыманая рэгрэсійная мадэль была ўжыта да ўнутраных і вонкавых набораў тэстаў і ацэнены ўзрост зубоў.
Быў распрацаваны алгарытм класіфікацыі, які выкарыстоўвае сталасць чатырох зубоў у наборы для навучання, каб прадказаць, 18 гадоў выбарцы ці не.Каб пабудаваць мадэль, мы атрымалі сем рэпрэзентатыўных алгарытмаў машыннага навучання6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost і (7) MLP .LR з'яўляецца адным з найбольш шырока выкарыстоўваных алгарытмаў класіфікацыі44.Гэта алгарытм падкантрольнага навучання, які выкарыстоўвае рэгрэсію для прагназавання верагоднасці прыналежнасці даных да пэўнай катэгорыі ад 0 да 1 і класіфікуе даныя як прыналежныя да больш верагоднай катэгорыі на аснове гэтай верагоднасці;у асноўным выкарыстоўваецца для бінарнай класіфікацыі.KNN - адзін з самых простых алгарытмаў машыннага навучання45.Пры атрыманні новых уваходных даных ён знаходзіць k даных, блізкіх да існуючага набору, а затым класіфікуе іх у клас з найбольшай частатой.Мы ўсталявалі 3 для колькасці разгляданых суседзяў (k).SVM - гэта алгарытм, які максімальна павялічвае адлегласць паміж двума класамі з дапамогай функцыі ядра для пашырэння лінейнай прасторы ў нелінейную прастору пад назвай fields46.Для гэтай мадэлі мы выкарыстоўваем зрушэнне = 1, магутнасць = 1 і гама = 1 у якасці гіперпараметраў для паліномнага ядра.DT прымяняецца ў розных галінах як алгарытм для падзелу ўсяго набору даных на некалькі падгруп шляхам прадстаўлення правілаў прыняцця рашэнняў у дрэвападобнай структуры47.Мадэль настроена з мінімальнай колькасцю запісаў на вузел 2 і выкарыстоўвае індэкс Джыні ў якасці меры якасці.RF - гэта ансамблевы метад, які аб'ядноўвае некалькі DT для павышэння прадукцыйнасці з выкарыстаннем метаду агрэгацыі пры загрузцы, які стварае слабы класіфікатар для кожнай выбаркі шляхам выпадковага малявання выбарак аднолькавага памеру некалькі разоў з зыходнага набору даных48.Мы выкарыстоўвалі 100 дрэў, 10 глыбінь дрэў, 1 мінімальны памер вузла і індэкс прымешкі Джыні ў якасці крытэрыяў падзелу вузлоў.Сакрэтнасць новых даных вызначаецца большасцю галасоў.XGBoost - гэта алгарытм, які аб'ядноўвае метады павышэння з дапамогай метаду, які прымае ў якасці вучэбных даных памылку паміж фактычным і прадказаным значэннямі папярэдняй мадэлі і павялічвае памылку з дапамогай градыентаў49.Гэта шырока выкарыстоўваны алгарытм з-за яго добрай прадукцыйнасці і эфектыўнасці выкарыстання рэсурсаў, а таксама высокай надзейнасці ў якасці функцыі карэкцыі перападбору.Мадэль абсталявана 400 апорнымі коламі.MLP - гэта нейронная сетка, у якой адзін або некалькі персептронаў утвараюць некалькі слаёў з адным або некалькімі схаванымі пластамі паміж уваходным і выходным пластамі38.Выкарыстоўваючы гэта, вы можаце выканаць нелінейную класіфікацыю, пры якой, калі вы дадаеце ўваходны ўзровень і атрымаеце выніковае значэнне, прагназуемае выніковае значэнне параўноўваецца з фактычным выніковым значэннем, і памылка распаўсюджваецца назад.Мы стварылі схаваны пласт з 20 схаванымі нейронамі ў кожным пласце.Кожная распрацаваная намі мадэль была прыменена да ўнутраных і знешніх набораў для праверкі эфектыўнасці класіфікацыі шляхам разліку адчувальнасці, спецыфічнасці, PPV, NPV і AUROC.Адчувальнасць вызначаецца як стаўленне выбаркі ва ўзросце 18 гадоў і старэй да ўзору ва ўзросце 18 гадоў і старэй.Спецыфічнасць - гэта доля выбарак ва ўзросце да 18 гадоў і асоб, паводле ацэнак, да 18 гадоў.
Стаматалагічныя этапы, ацэненыя ў навучальным наборы, былі пераўтвораны ў лікавыя этапы для статыстычнага аналізу.Шматмерная лінейная і лагістычная рэгрэсія былі выкананы для распрацоўкі прагнастычных мадэляў для кожнага полу і атрымання формул рэгрэсіі, якія можна выкарыстоўваць для ацэнкі ўзросту.Мы выкарыстоўвалі гэтыя формулы для ацэнкі ўзросту зубоў як для ўнутраных, так і для знешніх набораў тэстаў.Табліца 4 паказвае мадэлі рэгрэсіі і класіфікацыі, якія выкарыстоўваюцца ў гэтым даследаванні.
Надзейнасць унутры і паміж назіральнікамі была разлічана з дапамогай статыстыкі Каппа Коэна.Каб праверыць дакладнасць DM і традыцыйных рэгрэсійных мадэляў, мы разлічылі MAE і RMSE, выкарыстоўваючы разліковы і фактычны ўзрост унутраных і знешніх тэставых набораў.Гэтыя памылкі звычайна выкарыстоўваюцца для ацэнкі дакладнасці прагнозаў мадэлі.Чым меншая памылка, тым вышэй дакладнасць прагнозу24.Параўнайце MAE і RMSE унутраных і знешніх набораў тэстаў, разлічаныя з дапамогай DM і традыцыйнай рэгрэсіі.Прадукцыйнасць класіфікацыі 18-гадовага рубяжа ў традыцыйнай статыстыцы ацэньвалася з дапамогай табліцы непрадбачаных выпадкаў 2 × 2.Разлічаныя адчувальнасць, спецыфічнасць, PPV, NPV і AUROC тэставага набору параўноўвалі з вымеранымі значэннямі мадэлі класіфікацыі DM.Дадзеныя выражаюцца як сярэдняе ± стандартнае адхіленне або лік (%) у залежнасці ад характарыстык даных.Двухбаковыя значэння Р <0,05 лічыліся статыстычна значнымі.Усе звычайныя статыстычныя аналізы праводзіліся з выкарыстаннем SAS версіі 9.4 (SAS Institute, Cary, NC).Рэгрэсійная мадэль DM была рэалізавана ў Python з выкарыстаннем бэкэнда Keras50 2.2.4 і Tensorflow51 1.8.0 спецыяльна для матэматычных аперацый.Мадэль класіфікацыі DM была рэалізавана ў асяроддзі аналізу ведаў Waikato і аналітычнай платформе Konstanz Information Miner (KNIME) 4.6.152.
Аўтары прызнаюць, што дадзеныя, якія пацвярджаюць высновы даследавання, можна знайсці ў артыкуле і дадатковых матэрыялах.Наборы даных, створаныя і/або прааналізаваныя падчас даследавання, даступныя ў адпаведнага аўтара па разумным запыце.
Ritz-Timme, S. і інш.Ацэнка ўзросту: сучасны ўзровень для задавальнення канкрэтных патрабаванняў судова-медыцынскай практыкі.інтэрнацыянальнасць.Ж. Юрыдычная медыцына.113, 129–136 (2000).
Шмелінг А., Райзінгер В., Гесерык Г. і Олзэ А. Сучасны стан судова-медыцынскай ацэнкі ўзросту жывых суб'ектаў для мэт крымінальнага пераследу.Крыміналістыка.лекі.Паталогія.1, 239–246 (2005).
Пан, Дж. і інш.Мадыфікаваны метад ацэнкі стаматалагічнага ўзросту дзяцей ва ўзросце ад 5 да 16 гадоў ва ўсходнім Кітаі.клінічны.Вуснае апытанне.25, 3463–3474 (2021).
Лі, С. С. і інш. Храналогія развіцця другіх і трэціх карэнных зубоў у карэйцаў і яе прымяненне для судова-медыцынскай ацэнкі ўзросту.інтэрнацыянальнасць.Ж. Юрыдычная медыцына.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY і Lee, SS. Дакладнасць ацэнкі ўзросту і ацэнкі 18-гадовага парога на аснове сталасці другіх і трэціх карэнных зубоў у карэйцаў і японцаў.PLoS ONE 17, e0271247 (2022).
Кім, JY і інш.Аналіз даных на аснове машыннага навучання перад аперацыяй можа прадказаць вынік лячэння пацыентаў з OSA.навука.Справаздача 11, 14911 (2021).
Хан, М. і інш.Дакладная ацэнка ўзросту з дапамогай машыннага навучання з умяшаннем чалавека або без яго?інтэрнацыянальнасць.Ж. Юрыдычная медыцына.136, 821–831 (2022).
Хан, С. і Шахін, М. Ад інтэлектуальнага аналізу даных да інтэлектуальнага аналізу дадзеных.Ж.Інфармацыя.навука.https://doi.org/10.1177/01655515211030872 (2021).
Хан, С. і Шахін, М. WisRule: першы кагнітыўны алгарытм для здабычы правілаў асацыяцыі.Ж.Інфармацыя.навука.https://doi.org/10.1177/01655515221108695 (2022).
Шахін М. і Абдула У. Карм: Традыцыйны інтэлектуальны аналіз дадзеных на аснове кантэкстных правілаў асацыяцыі.разлічыць.Мэт.працягнуць.68, 3305–3322 (2021).
Мухамад М., Рэхман З., Шахін М., Хан М. і Хабіб М. Выяўленне семантычнага падабенства на аснове глыбокага навучання з выкарыстаннем тэкставых даных.інфармаваць.тэхналогій.кантроль.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Табіш, М., Танолі, З., і Шахін, М. Сістэма для распазнання актыўнасці ў спартыўных відэа.мультымедыя.Прыкладанні інструментаў https://doi.org/10.1007/s11042-021-10519-6 (2021).
Халабі, С. С. і інш.Задача машыннага навучання RSNA ў дзіцячым касцяным узросце.Радыялогія 290, 498–503 (2019).
Лі, Ю. і інш.Судова-медыцынская ацэнка ўзросту па рэнтгенаўскіх здымках органаў малога таза з выкарыстаннем глыбокага навучання.ЕЎРА.выпраменьванне.29, 2322–2329 (2019).
Guo, YC і інш.Дакладная ўзроставая класіфікацыя з выкарыстаннем ручных метадаў і глыбокіх згортачных нейронавых сетак з арфаграфічных праекцыйных малюнкаў.інтэрнацыянальнасць.Ж. Юрыдычная медыцына.135, 1589–1597 (2021).
Алабама Далора і інш.Ацэнка касцявога ўзросту з выкарыстаннем розных метадаў машыннага навучання: сістэматычны агляд літаратуры і мета-аналіз.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K., і Yang, J. Ацэнка ўзросту афраамерыканцаў і кітайцаў, заснаваная на аб'ёмах пульпарнай камеры першых карэнных зубоў з дапамогай конуса-прамянёвай кампутарнай тамаграфіі.інтэрнацыянальнасць.Ж. Юрыдычная медыцына.136, 811–819 (2022).
Кім С., Лі Ю.Х., Но Ю.К., Парк Ф.К. і О К.С. Вызначэнне ўзроставых груп жывых людзей з выкарыстаннем малюнкаў першых карэнных зубоў на аснове штучнага інтэлекту.навука.Справаздача 11, 1073 (2021).
Стэрн, Д., Пэйер, К., Джуліяні, Н., і Уршлер, М. Аўтаматычная ацэнка ўзросту і класіфікацыя паўналетняга ўзросту па дадзеных шматмернай МРТ.IEEE J. Biomed.Абвесткі пра здароўе.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. і Li, G. Ацэнка ўзросту на аснове 3D-сегментацыі пульпарнай камеры першых карэнных зубоў з конусапрамянёвай кампутарнай тамаграфіі шляхам інтэграцыі глыбокага навучання і набораў узроўняў.інтэрнацыянальнасць.Ж. Юрыдычная медыцына.135, 365–373 (2021).
Wu, WT і інш.Інтэлектуальны аналіз дадзеных у клінічных вялікіх дадзеных: агульныя базы дадзеных, этапы і мадэлі метадаў.Свет.лекі.рэсурс.8, 44 (2021).
Ян, Дж. і інш.Уводзіны ў медыцынскія базы даных і тэхналогіі здабычы дадзеных у эпоху вялікіх даных.Я. Авід.Асноўная медыцына.13, 57–69 (2020).
Shen, S. і інш.Метад Камерэра для ацэнкі ўзросту зубоў з дапамогай машыннага навучання.BMC Oral Health 21, 641 (2021).
Галібург А. і інш.Параўнанне розных метадаў машыннага навучання для прагназавання ўзросту зубоў з выкарыстаннем метаду стадыі Дэмірдж'яна.інтэрнацыянальнасць.Ж. Юрыдычная медыцына.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. і Tanner, JM Новая сістэма для ацэнкі стаматалагічнага ўзросту.фыркаць.біялогіі.45, 211–227 (1973).
Landis, JR, і Кох, GG Меры назіральнікаў згоды на катэгарычных дадзеных.Біяметрыя 33, 159–174 (1977).
Бхаттачарджы С, Пракаш Д, Кім С, Кім Х.К. і Чой Х.К.Тэкстурны, марфалагічны і статыстычны аналіз двухмернай магнітна-рэзананснай тамаграфіі з выкарыстаннем метадаў штучнага інтэлекту для дыферэнцыяцыі першасных пухлін галаўнога мозгу.Інфармацыя пра здароўе.рэсурс.https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Час публікацыі: 4 студзеня 2024 г