It компании помогают геномной медицине

It компании помогают геномной медицине

Столичный центр разработок и исследований EMC по облачным вычислениям и громадным данным в Сколково трудится над проектом создания новой разработке для поиска информации в хранилищах данных со сложной структурой связей между элементами. В таких совокупностях требуется обход графа* для нахождения подходящих определения и элементов их похожести. Разработка будет нужна везде, где необходимо трудиться c громадными коллекциями данных разной природы – в первую очередь на уровне метаданных (содержательных описаний массивов информации), разрешая обнаружить и применять заблаговременно не очевидные связи между объектами.

Смотрите кроме этого: Melomind стали первыми в мире наушниками с разработкой ЭЭГ

Компания myBrain Technologies создала наушники называющиеся Melomind, каковые призваны оказать помощь людям более действенно расслабляться. Как уверяют разработчики, это первая в мире гарнитура с применением электроэнцефалографической технологии (ЭЭГ), которая разрешает делать диагностику состояния пользователя. По мнениюmyBrain Technologies, стресс есть неотъемлемым элементом нашей жизни, исходя из этого они желали создать устройство, которое бы разрешило уменьшить его действие на организм.

Одним из наиболее значимых и актуальных направлений применения системыявляется геномная медицина, где количества данных громадны, и имеют большое число внутренних и внешних связей (ссылки на публикации, на родные термины в онтологиях и т.п.)

В собственной финальной стадии он направлен на создание эргономичной инфраструктуры, которая окажет помощь исследователю и врачу отыскать возможно полезную для лечения данные значительно действеннее и интеллектуальнее, чем это происходит на данный момент.

Пример того, как выглядит граф

Источник: Goh K et al. «The Human Disease Network», PNAS 2007; 104: 8685-8690

Проблематика

Существует множество онтологий – сложно структурированных «словарей»,ссылающихся друг на друга. К примеру, имеется онтологии заболеваний,генов, базы ассоциаций (установленных связей между, к примеру, вероятностью и генетическими вариантами тех либо иных болезней), и т.д. Еще имеется «факторы окружения»: к ним относятся курение, приём спиртного, радиация при лечении рака, лекарственные препараты — всё, что воздействует на возможность происхождения заболевания, её лечение и течение.

Для их описания также применяют онтологии – к примеру, онтологию лекарств DrugBank, онтологию биологически значимых химических соединений CHEBI, объединённую онтологию фармацевтических веществ RxNorm и т.д.

Для описания фенотипа, в этом случае заключений болезней, при создании совокупности употреблялись онтологии DOID (либо легко DO – Disease Ontology), и HPO (Human Phenotype Ontology), для описания генотипа —GO и faldo. на данный момент совокупность начинается, для описания заключений добавляется ICD10, для описания генетических качеств— RefSeq и GenCode.

В совокупности это терабайты данных. Дабы ориентироваться в этом потоке информации, необходимо верно организовать запрос и настроить поиск. Но как раз тут и имеется главное препятствие: эти имеют различную структуру, формат, содержат множество ссылок друг на друга и на внешние источники. Это большие количества литературы и в открытом, и закрытом доступе.

Массивы смогут быть разбросаны по Интернету либо не выходить за пределы одной клиники. Информация довольно часто не формализована, не стандартизирована.

Появляется вопрос, как корректно и действенно делать запросы в один момент к бессчётным рассеянным базам данных, имеющим различную структуру, и приобретать осмысленный ответ о связях разных составляющихнаходящейся в том месте информации (геномных, фенотипических, факторов окружения и тд.)? Самое серьёзное – как обнаружить и учитывать не только очевидно заданные ссылками связи между элементами данных, но и смысловые, неявные связи.

Решение проблемы

Столичный центр разработок и исследований EMC видит решение проблемы в создании совокупности на базе проиндексированной многофункциональной базы данных. Концепция в том, дабы объединять массивы данных из самых различных источников, разбирать их и выявлять связи.

Пилотная версия совокупности разрешает эксперту послать запрос ко всему массиву, отыскать эти за доли секунды и взять развернутый ответ с учетом всех вероятных связей, и что принципиально важно — контекста, даже в том случае, если прямого указания на него нет. Так, доктор можетпосмотреть, к примеру, какие конкретно лекарства употреблялись при конкретных либо сходных заболеваниях при различных вариантах геномных параметров, и узнать ответ не только на собственный прямой вопрос, но и на родные вопросы, каковые смогут ему оказать помощь в принятии ответа.

Проект на данный момент находится на исследовательском уровне, потом его применение в науках и медицине о жизни будет кроме этого обсуждаться в рабочих группах Глобального альянса по геномике и здравоохранению (GA4GH). Полностью аналогов данной технологии до тех пор пока нет.

Работа совокупности

Сперва совокупность кластеризует, другими словами объединяет громадные эти по схожести (кроме того в случае если взаимосвязи нет) и фильтрует их. При громадной выборки первой появляется та информация, которая оптимальнее отвечает на запрос поиска. Для этого употребляются разные механизмы ранжирования найденных результатов по их релевантности.

Бывают обстановке, в то время, когда искомой информации мало и нужно применять связи с другими фрагментами данных. Разрабатываемый Центром EMC проект оказывает помощь обнаружить эти вместе с облаком контекста, в котором они находятся. Пользователь может задать конкретное лекарство, ген и болезнь.

В ответ совокупность выдает неочевидную, на первый взгляд,сообщение этих параметров. Она может посоветовать эксперту пути к более действенному лечению.

Так, совокупность станет ответственным и ускоряющим компонентом для ежедневной работы эксперта, которому на данный момент кроме того в самых продвинутых клиниках мира приходится самостоятельно, руками, при отсутствии единого интерфейса искать данные по бессчётным базам данных.

Принципиально важно подчернуть, что совокупность не есть рекомендательным сервисом: программа ничего не рекомендует, а активизирует поиск нужных данных и автоматизирует множество процессов. Решения по другим целям и лечению принимаются самими экспертами.

Реализация концепции предполагает, что поисковый «движок» возможно будет развёртывать на площадях клиентов. Это разрешает включить в поиск эти по больным больниц. В большинстве случаев такие эти запрещается передавать третьим лицам, а организовать поиск по таким базам при помощи публичных сервисов обычно нереально.

Возможно будет применять федеративный поиск – нахождение информации на удаленных источниках. В функционале имеется возможность отключать выдачу конкретного типа данных, включать поиск по публичным и собственным базам.

Совокупность окажет помощь медицинским экспертам самого различного уровня:

• она ускорит работу докторов, каковые до сих пор самостоятельно ищут данные в бессчётных источниках.

• она создаст нужную инфраструктуру для клиник. Совокупность архивирует данные в многофункциональной базе данных, в которой сохраняются исами документы, и связи между ними. В результатеу клиник будет возможность собрать накопленные знания, комфортно укомплектовать и действенно в них ориентироваться, пользуясь только ноутбуком.

Проект, над которым трудится команда русских экспертов вместе с зарубежными сотрудниками из компании EMC, уже взял хорошие отзывы на выставке-конференции в области IT, биоинформатики и геномной медицины  BioIT World, прошедшей в первых числах Апреля 2016 года. Параллельно налаживается сотрудничество с большой американской клиникой, которое разрешит проверить работу совокупности в приложении к клинической практике.

В русских реалиях эта совокупность кроме этого возможно применена, и Столичный центр разработок и исследований EMC по облачным вычислениям и громадным данным открыт к сотрудничеству.

Указанный функционал –только часть пилотного проекта. В финальной версии совокупность уже сможет разбирать целые группы больных с разными параметрами генов, признаков, болезней. Что особенно принципиально важно, геномными предоставит шанс разработки не ограничиваются.

В дизайне совокупности нет ничего сугубо своеобразного для наук и медицины о жизни, исходя из этого область ее применения в будущем возможно очень сильно увеличить.

* Тут граф – это структура данных, что-то наподобие социальной сети разнообразные описаний, документов и т.п., где в узлах сети документы, а связи между ними показывают, как один документ связан с другим. К примеру, определение руки содержит ссылку на описание пальцев. Определение рака ссылается на различные виды рака, они – на различные подвиды.

Одна заболевание возможно связана с другой не только как подвид, но и как родственная структура.

Леонид Левкович-Маслюк, директор по инновациям и науке в RD Центре EMC?

Случайная статья:

ШОКИРУЮЩАЯ ПРАВДА ПРО IT КУРСЫ — Часть 1 — Как тебя разводят


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.