Нейронные сети сегодня широко используются для анализа сложных данных — например, чтобы найти причину заболевания в генетической информации. Однако, в конечном счете, никто не знает, как эти сети в действительности работают. Именно поэтому исследователи создали приложение, которое позволяет им заглянуть внутрь этих черных ящиков и проанализировать, как же они функционируют. Исследователи представят свое приложение на CeBIT в Ганновере с 20 по 24 марта 2017 года.
Сортировка фотографий на компьютере была скучным занятием. Сегодня, вы просто кликаете на распознавании лица и немедленно получаете выборку фотографий вашей дочери или сына. Компьютеры преуспели в анализе больших объемов данных и поиске определенных структур, таких как лица на картинках. Это стало возможным благодаря нейронным сетям, которые развились в установленный и сложный метод IT анализа.
Проблема не только в том, что исследователи не знают, как именно шаг за шагом работают нейронные сети, или почему они выдают тот или иной результат. Нейронные сети, в определенном смысле, черные ящики — компьютерные программы, которым люди отдают данные и которые надежно выдают результаты. Если вы хотите обучить нейронные сети, например, чтобы распознавать котов, тогда вы обучаете систему путем подачи тысяч картинок котов системе. Как маленький ребенок, который медленно учится различать котов от собак, нейронная сеть, точно так же, автоматически учится. «Однако, во многих случаях, исследователи меньше заинтересованы в результате и намного более заинтересованы в том, что именно нейронная сеть делает — как она принимает решения,» говорит Доктор Wojciech Samek, глава Группы Машинного Обучения в Fraunhofer Heinrich Hertz Institute HHI в Берлине. Samek и его команда, в сотрудничестве с коллегами из TU Berlin, разработали метод, который делает возможным просмотр того, как думает нейронная сеть.
Машинное обучение делает возможным создание персонализированных лекарств от рака
Это важно, например, в выявлении заболеваний. Мы сегодня уже имеем возможность отдать генетические данные пациента в компьютеры — или нейронные сети — которые затем анализируют возможность пациента иметь определенное генетическое заболевание. «Но было бы еще более интересно точно знать, на каких характеристиках программа основывает свое решение,» говорит Samek. Это могут быть определенные генетические дефекты, которые имеет пациент — и это, в свою очередь, может быть возможной целью для лекарства от рака, которое создается индивидуально пациенту.
Нейронные сети в обратном порядке
Метод исследователей позволяет им смотреть в обратном порядке работу нейронных сетей: они идут назад, начиная с результата. «Мы можем увидеть, где именно определенная группа нейронов сделала определенное решение, и как сильно это решение повлияло на результат,» говорит Samek. Исследователи уже продемонстрировали — несколько раз — что метод работает. Например, они сравнили две программы, которые общедоступны в Интернете и которые могут распознавать лошадей на изображениях. Результат был неожиданный. Первая программа действительно распознала лошадей. Однако, вторая сконцентрировалась на символах копирайта на фотографиях, которые указывали на форумы для любителей лошадей, или ездовые и селекционные ассоциации, позволяя программе заработать высокую оценку даже при том, что она так и не узнала, как выглядят лошади.
Применение в Big Data
«Теперь вы видите, как важно понимать то, как именно работают нейронные сети,» говорит Samek. Эти знания также вызывают особый интерес в индустрии. «Это мыслимо, например, что рабочие данные сложного производственного предприятия могут быть проанализированы для прослеживания, какие параметры влияют на качество продукции или вызывают неустойчивость,» говорит он. Изобретение также интересно для многих других приложений, которые включают в себя нейронный анализ больших и сложных объемов данных. «В другом эксперименте, мы смогли показать, какие параметры использует сеть, чтобы решить, лицо молодое или старое.»
По словам Samek, уже долгое время банки используют нейронные сети для анализа кредитоспособности клиентов. Для этого большие объемы данных клиентов собираются и оцениваются нейронной сетью. «Если бы мы знали, как сеть принимает решение, мы могли бы уменьшить объем данных изначально, выбрав только нужные параметры,» он говорит. Это определенно было бы в интересах клиентов тоже. На CeBIT ярмарке в Ганновере с 20 по 24 марта 2017 года команда исследователей Samek продемонстрирует, как они используют свое приложение для анализа черных ящиков нейронный сетей — и как эти сети могут определить возраст и пол человека по его лицу, или распознавать животных.