Рак — это генетическое заболевание, вызванное телесными мутациями в геномах. Различие между «водительской» и «пассажирской» мутацией является важной задачей для функционализации геномики рака при лечении пациентов. Задача состоит в том, чтобы отличить мутации, которые ведут к росту мутационного ядра (драйверов) от доброкачественных (пассажирских) мутаций. Как правило, поиск определений и анализ этих патогенных клеток производится вручную. Нам нужно автоматизировать анализ текста и алгоритмы машинного обучения. Также мы должны сравнить различные методы, чтобы найти лучший. Минимальное значение Logg-Loss получается при применении алгоритма kNN.