Развенчание шумихи в отношении искусственного интеллекта при диагностике рака кожи
Взрыв заявлений о производительности искусственного интеллекта (ИИ) для дерматологии затуманивает способность отделять шумиху от реальности. Они, как правило, рассматривают состояние диагностики, с применением нейросетей, на основе изображений в дерматологии, уделяя особое внимание влиянию на реальный мир для потребителей, врачей общей практики и дерматологов. Практика показывает, что, хотя существует множество возможностей, но сохраняется значительная потребность в дополнительных испытаниях, а также оценке результатов в реальных условиях. Несмотря на это, на этом поприще уже выпущено множество приложений для прямого доступа к потребителю.

Один из недавних опросов показал, что 41% людей доверяют приложению на основе ИИ для диагностики рака кожи, хотя средняя их диагностическая точность составляла от 50 до 60%. Следует отметить, что новые потребительские алгоритмы, протестированные в ранних проспективных испытаниях в Австрии, показали некоторые перспективы (чувствительность/специфичность более 90%). Однако такие доказательства всё ещё являются предварительными и используют изображения, полученные врачом, а не независимыми экспертами. Многие из существующих исследований медицинских приложений страдают от низкого методологического качества, включая высокий риск предвзятости. Например, при оценке высококачественных изображений, полученных врачами, по сравнению с реальными изображениями пациентов, и плохой обобщаемости, связанной с оценкой в искусственных условиях, диагностическая точность падает более, чем на 30%. А если ещё провести тесты изолированно без дополнительной истории болезни пациента, то вообще сомнительно, что результативность поднимется выше 50%.
Вообще мало кто знает, что разработчикам ИИ не требуется перечислять доказательства, подтверждающие диагностические возможности их алгоритмов, как того требует законодательство многих стран. Испытания не проводятся согласно строгим сводным стандартам отчётности, как для медицинского оборудования, что вызывает опасения по поводу обмана потребителей, особенно когда важная диагностическая информация предоставляется без надлежащего консультирования со стороны медицинских работников.
Диагностика на основе изображений, с использованием нейросетей, показывает некоторые перспективы в оказании помощи врачам общей практики и потенциальном улучшении доступа за счёт поддержки телемедицины. Однако в целом алгоритмы плохо работают на изображениях, недостаточно представленных в их обучающих наборах данных, которые, как правило, состоят из распространённых состояний на светлой коже в идеализированных условиях, а не из полного клинического спектра заболеваний на коже разных тонов. Исследования по повышению эффективности работы дерматологов более многочисленны, но указывают на то, что медицинское сообщество всё ещё находится на ранних этапах понимания того, какие инструменты действительно обеспечат значимое клиническое воздействие. Исследования, оценивающие возможности искусственного интеллекта для дерматологов, проводились в искусственных условиях, которые не отражают практику реального мира.
Фактически, когда представленные модели искусственного интеллекта сопоставляются с дерматологами в реальных условиях, дерматологи превосходят их в диагностическом опыте. Исследования, которые действительно показывают многообещающие результаты, были сосредоточены на сотрудничестве дерматолога и приложения, при этом алгоритмы оказались наиболее полезными для начинающих дерматологов. Однако сейчас необходимы дополнительные испытания, в которых всё тестируется в реальных клинических условиях, чтобы гарантировать пользу для пациента.
По мере того как мы смотрим в будущее, хотя автономные диагностические алгоритмы на основе изображений имеют свои преимущества, область все больше движется в сторону алгоритмов, которые более тесно связаны с рабочей моделью клинициста, который синтезирует несколько источников информации и ссылается на надёжные текстовые ресурсы, чтобы прийти к окончательному диагнозу и плану лечения. Но для разработки действительно эффективных инструментов необходима база знаний и доступ к единому дата-центру (серверам, облачному хранилищу), где будут сосредоточены действительно рабочие наборы данных для глубокого обучения нейросетей.
Приложения должны быть реализованы с помощью мультимодальных моделей, которые, теоретически, могут включать несколько типов входных данных, таких как изображения, история болезни, результаты лабораторных исследований, интерпретация патологии, геномика и ход времени, в окончательный диагноз. Помимо обеспечения более высокой степени точности за счёт обработки выходных данных на основе высококачественных источников, приложения также могут предоставить конечному пользователю отрывки со ссылками на источники, которые нейросеть использовала для получения своего ответа, что повышает прозрачность и упрощает процесс проверки.
Подводя итог, можно сказать, что, хотя область диагностики на основе изображений быстро развивается, текущих исследований недостаточно, чтобы предложить определённую клиническую полезность. Возможно, больше всего доказательств существует для приложений дополненной реальности, ориентированных на дерматологов. Но даже в рамках этого показания потребуются более надёжные исследования для адекватной оценки реальной ценности и безопасности. Будущие исследования должны быть сосредоточены на повышении прозрачности и реальной валидации (с точки зрения наблюдаемых состояний, различных оттенков кожи и реалистичных рабочих процессов исследования). С ростом больших языковых моделей и мультимодальных крупномасштабных моделей будущее машинного обучения в дерматологии, вероятно, также будет включать модели, которые включают несколько источников информации, более точно имитируя рабочие процессы клиницистов.