SkazOff Blog

BI

Применение BI-систем

Статья в журнал «Врач и информационные технологии».

Применение BI-систем для анализа данных медицинских регистров

В настоящее время начинают появляться разработки, направленные на интеграцию различных лечебных учреждений в единое информационное пространство. Они позволяют улучшить взаимодействие лечебных учреждений, оптимизировать их загруженность и предоставлять более качественную медицинскую помощь пациентам.

Все разработки используемые в медицине делятся на следующие классы:

  • медицинские информационные системы, предназначенные для комплексной автоматизации медицинских учреждений (КМИС);
  • телемедицинские и web-ориентированные системы для удаленного мониторинга;
  • медицинские регистры и системы оценки состояния здоровья населения;

  • интеллектуальные системы для диагностики и поддержки принятия врачебных решений.

Описанные классы медицинских систем решают различные (иногда пересекающиеся) задачи.

В частности, медицинские регистры, представляющие собой информационную систему для сбора и обработки информации, ориентированы на определенную географическую территорию (округ, регион, страна) и фиксацию строго определенных показателей для принятия различных диагностических и управленческих решений. Регистры, как правило, должны быть легки в поддержке и эксплуатации, иметь прозрачные интуитивно понятные интерфейсы для их эффективного и быстрого внедрения. От этого зависит качество и оперативность собираемых данных, которые агрегируются из множества лечебно-профилактических учреждений (ЛПУ) в информационной системе. Медицинские регистры могут иметь достаточно широкую функциональность и использоваться широким классом пользователей из различных лечебных учреждений, и при этом они ориентированы на достаточно узкий спектр задач по регистрации пациентов.

Одной из характеристик медицинских регистров является количество регистрируемых показателей, которые могут быть статическими и динамическими. Статические показатели (дата рождения, место рождения и др.) единожды вносятся в регистр, динамические (диагноз, лечение и так далее) могут изменяться во времени, причем изменение может носить характер обязательности, к примеру, если пациент должен обследоваться один раз в год. В качестве примера в Российском федеральном регистре больных сахарным диабетом фиксируется порядка трехсот показателей. Для анализа этих показателей необходимо реализовать возможности, позволяющие выполнять:

  • статистический анализ и отчеты;
  • оценку эпидемиологической ситуации;
  • оценку заболеваемости, смертности и выживаемости;
  • распределение материальных средств на покупку новых препаратов и оборудование;

  • оптимизация загруженности персонала и ЛПУ.

Одной из существующих проблем является то, что не все действующие медицинские регистры позволяют выполнить требуемый анализ данных, тип которых зависит от того, в какой программной среде они были разработаны.

Цель проектируемого модуля — автоматизация анализа данных для любых типов данных на примере обработки медицинской статистики Новосибирского диабетологического центра. В их регистр поступают данные с различных лечебно-профилактических учреждений, а также по районам, и населенным пунктам Новосибирской области. Данные представляют собой числовые, текстовые и другие показатели распространенности различных заболеваний, количества больных, смертности и тому подобное. За время функционирования регистра диабета Новосибирска, накоплен достаточно обширный банк данных, поэтому возникает задача рационального хранения, и использования этих данных, получение из них знаний, с целью возможности прогнозирования и принятия решений, способствующих более эффективному функционированию [1].

Для решения задачи анализ данных могут использоваться, например, BI-системы (BI — бизнес-анализ), которые позволяют проводить анализ больших объемов данных, заостряя внимание на ключевых факторах, моделируя различные возможные исходы. Помимо отчетности эти системы включают инструменты интеграции и очистки данных (ETL),  аналитические хранилища данных и средства Data Mining [2]. Применение Data Mining в медицине, предоставляет множество преимуществ, среди которых, стоит отметить следующие:

  • возможность легко выбрать необходимые медикаменты для лечения болезни;
  • определить показания и противопоказания для каждого отдельного случая;
  • выбрать необходимые процедуры, которые позволят избавиться от заболевания за максимально короткий промежуток времени;
  • предсказать, как тот или иной метод лечения повлияет на пациента и многое другое.

В настоящее время есть множество различного ПО,  реализующее эту технологию.

К лидерам рынка BI-платформ можно отнести решения от компаний Business Objects и SAP, а на рынке расширений для СУБД представлено большинство поставщиков корпоративных СУБД, например, Microsoft и Oracle. Однако для небольших или недавно открывшихся компаний подобные продукты окажутся слишком дорогими и кроме того, большая часть их возможностей просто останется невостребованной из-за малого количества накопленной информации. Поэтому подобным компаниям стоит обратиться к BI-каркасам, где тоже представлены решения, способные решать различные BI-задачи.

На этом сегменте рынка присутствуют решения с открытым исходным кодом и, что особенно удобно для клиента, начальные версии продуктов предоставляются на безвозмездной основе в рамках существующих открытых лицензий, возможностей этих версий вполне достаточно для решения базовых BI-задач. Одним из наиболее известных BI-решений с открытым исходным кодом является продукт Pentaho BI Suite от Pentaho Corporation.Компания Pentaho также является известным игроком на рынке BI-решений с открытым исходным кодом, при этом она изначально работала только на рынке BI и поэтому, возможно, не очень известна в среде разработчиков.

Продукт Pentaho BI Suite разработан на языке программирования Java, поэтому обладает всеми преимуществами и недостатками, свойственными Java-приложениям. К преимуществам относится мультиплатформенность, благодаря которой Pentaho BI Suite может работать на разных ОС, при этом однозначно поддерживаются:

  • Windows XP SP2 и выше;
  • современные дистрибутивы Linux, Solaris 10;
  • MacOS X 10.4 и выше.

С помощью PentahoBISuite для регистра больных сахарным диабетом города Новосибирска был разработан информационно-аналитический модуль решающий следующие задачи:

1) Анализ заболеваемости диабетом среди детей и подростков;

2) Определение возрастных групп риска, наиболее подверженных заболеванию;

3) Выявление связей между показателями заболеваемости по определенным видам диабета;

4) Выявление показателей заболеваемости в различных населенных пунктах;

5) Анализ по территориальному расположению больниц и больных.

Для его реализации использовалась технология OLAP, или оперативной аналитической обработки данных (On-Line Analytical Processing). В её основе лежит многомерное представление данных (Multidimensional conceptual view). Главная идея этой системы состоит в представлении информации в виде многомерных таблиц, доступных через запросы пользователей. Эти таблицы или так называемые многомерные кубы строятся на основе исходных и агрегированных данных, которые могут храниться как в реляционных, так и в многомерных базах данных. Используя возможности OLAP-системы, можно быстро осуществлять просмотр любой информации, получать любые выборки, статистики, анализировать данные, в том числе сравнивать их во времени. Вся работа с OLAP-системой происходит в терминах рассматриваемой предметной области. Пользователь в сжатые сроки может проанализировать накопленные данные за счет быстрого и согласованного доступа.

При разработке модуля для регистра диабета было создано пять OLAP-кубов, предоставляющие необходимую информацию.

Поля «ЛПУ», «Город», «ФИО» и другие из таблиц регистра, являются измерениями куба. Фиксируя определенные значения измерений, можно получать срезы куба, каждый из которых представляет собой информацию, скомпонованную на основе множества взаимосвязанных таблиц. Технология OLAP, помимо кросс-таблиц, также позволяет отображать данные в виде диаграмм. Такой способ отображения информации является наиболее наглядным и удобным.

Например, для задачи анализа заболеваемости диабетом среди детей и подростков необходимы данные из четырех таблиц регистра:

  • таблица «pacient_main»: Общая таблица пациентов, которая также выбрана как таблица фактов;
  • таблица «rayons»: Районы — содержит перечень районов города Новосибирска с их ID в БД;
  • таблица «Type_Diabet»: Содержит перечень типов диабета с их ID в БД;
  • таблица «Profession»: содержит перечень рода деятельности пациентов с соответствующими ID в БД.

После выбора таблиц создаются связи между ними. Pentaho BA позволяет автоматически создавать подобные SQL-запросы. В результате этих операций создается источник данных для OLAP-куба.

В созданном источнике данных необходимо добавить определенные параметры (в данном случае счетчик больных при различных видах анализа). В итоге на основе этого источника данных строится OLAP-куб.

С помощью добавления различных фильтров возможно получать требуемые данные, например:

  • количество больных диабетов в Новосибирске по всем родам деятельности (пенсионеры, школьники, рабочий, служащий и другие);
  • распределение их по районам города, а также по принадлежности к ЛПУ;
  • распространение типов диабета по районам и по родам деятельности;

  • и многое другое.

Полученные результаты представляются в виде отчетов различной формы (различные таблицы, диаграммы, графики, географические карты).

Один из вариантов использования созданного куба — создание отдельного дашборда, обеспечивающего удобство работы. Запуск происходит с помощью обычного браузера. При этом данные автоматически синхронизируются с текущими данными в БД. В дашбордах возможно объединять несколько кубов, а сами дашборды возможно объединять в систему.

Разработанный модуль был протестирован на копии регистра больных сахарным диабетом города Новосибирска.

Регистр реализован в среде ACCESS. Данные собирались из ЛПУ и централизованно с определенной периодичностью вносились в регистр диабета. Это было связано со сложностью данного процесса и с обеспечением безопасности, что в свою очередь требовало определенной квалификации, которой не обладали работники ЛПУ. Для получения «нестандартной» информации требовалась разработка дополнительных запросов и форм с учетом множества связей внутри БД, что зачастую вызывало проблемы в реализации. Для решения этих проблем и был разработан и протестирован модуль для анализа данных регистра.

Тестирование проводилось в следующей последовательности:

1) Выбирались тестовые параметры, на основе которых и проходила проверка и фиксировались текущие значения тестовых параметров в БД;

2) Проводился анализ в OLAP-кубе, результаты анализа фиксировались;

3) Были внесены изменения в БД (изменялись тестовые параметры);

4) Повторно проводился анализ в OLAP-кубе, результаты, выводимые в дашборд, фиксировались;

5) Сравнивались результаты тестирования с ожидаемыми результатами.

Результаты теста показали, что модуль полностью работоспособен, удобен в эксплуатации и позволяет проводить анализ данных регистра в реальном времени. В данном модуле реализовано пять OLAP-кубов решающих поставленные задачи. При этом разработанный модуль позволяет легко создавать новые OLAP-кубы под новые задачи. Наличие графического интерфейса модуля делает эту операцию относительно простой и с ней справится штатный программист лечебного учреждения.

Использование BI-технологий дает возможность реализовать подобные модули и для других существующих регистров с минимальными затратами.

Список литературы:

  • Применение методов DataMining в системе обработки и анализа медикостатистической информации // Портал магистров ДонНТУ URL: http://masters.donntu.edu.ua/2005/kita/tevelev/library/lib3.htm (дата обращения: 21.05.14).
  • Помогает ли BI преодолевать трудные времена? // PcWeek URL: http://www.pcweek.ru/business/article/detail.php?ID=120748 (дата обращения: 21.05.14).

Оставить комментарий