Энергетический реактор на быстрых нейтронах Действующие реакторные технологии Перспективы развития быстрых реакторов Российская программа по быстрым реакторам  Гомогенный реактор с отражателем Ядерная энергетика

Энергетический реактор на быстрых нейтронах

Разработка системы поиска документов по таксономии СОЗ БР

Подразделение по Управлению Знаниями Департамента Ядерной Энергетики МАГАТЭ проводит активную работу, которая, по моему мнению, способна изменить ситуацию и помочь коллективной работе по созданию единого хранилища знаний по быстрым реакторам на основе таксономии СОЗ БР [28].

Таксономия была создана с целью каталогизации данных. Это специальная структура с помощью которой по заданному запросу можно получить методанные или документы, соответствующих данному запросу.

Для успешного поиска информации в СОЗ БР необходимо присвоить наборы ключевых слов каждому элементу таксономии.

Развитие индустрии систем электронного документооборота требует новых средств обработки полнотекстовой информации, основанных на лингвистическом анализе текста и включающих элементы искусственного интеллекта. Доступные сегодня вычислительные мощности позволяют применить широкий класс методов для обработки больших массивов документов, эффективно решая задачи поиска, классификации, кластерного анализа, выявления скрытых закономерностей и другие.

Успешная работа таксономии по быстрым реакторам требует построения информационно-поисковой системы, для этого необходимо подобрать ключевые слова (дескрипторы) документов для их успешного присвоения каждому элементу таксономии.

Все ключевые слова взяты из тезауурса ИНИС, который представляет словарь терминов с семантическими отношениями между ними. Моя работа призвана повысить качество поиска информации.

Мое исследование состояло в работе с ключевыми словами только на английском языке. Для успешного присвоения дескрипторов необходимо было обеспечить присвоение дескрипторов с учетом всех грамматических форм слов на основе морфологического анализа.

Весь процесс сортировки и приклепления ключевых слов осуществлялся при помощи программного продукта Microsoft Access, СУБД корпорации Microsoft. Access имеет широкий спектр функций, включая связанные запросы, сортировку по разным полям, связь с внешними таблицами и базами данных. В Access можно писать приложения, работающие с базами данных.

Таксономия СОЗ БР будет использоваться значительной частью пользователей как инструмент для поиска наиболее полной и точной информации по быстрым реакторам. Однако, для успешного функционирования таксономии необходимо как можно точнее прикрепить документы по быстрым реакторам к элементам таксономии, чтобы сделать процесс сохранения и управления знаниями наиболее эффективным.

Для этого было предложено присвоить всем элементам таксономии набора метаданных, присвоенными специалистами каждому документу по быстрым реакторам.

Интерфейс сервиса должен позволять проводить поиск данных по элементам таксономии и просматривать по желанию пользователя имеющиеся документы и метаданные.

Присвоение дескрипторов документов (дескриптор - лексическая единица информационно-поискового языка, служащая для описания основного смыслового содержания документов и для формулировки информационных запросов при поиске документов в информационно-поисковой системе) должно осуществляться по специально разработанной схеме. Для получения необходимого качества выдаваемых документов метаданные рекомендуется редактировать по определенным критериям.

Так же необходимо предусмотреть возможность отнесения документа к нескольким тематическим разделам таксономии.

В ходе моей работы были выработанны некоторые методические принципы и требования по прикреплению дескрипторов технических документов к элементам таксономии, и мной было предложенно выстроить систему прикрепления ключевых слов определенным образом.

Ранее поиск осуществлялся строго по самому элементу таксономии, а именно неделимому словосочетанию, из которого состоит элемент таксономии. Очевидно, что очень часто поиск только по такой фиксированной фразе является неудовлетворительным, в частности в нем будет отсутствовать поиск по отдельным словам, входящим в словосочетание элемента таксономии, либо по обратному порядку слов. В этом случае я корректировала параметры поиска, задавая различные критерии.

Основным преимуществом предлагаемой модели является то, что пользователи получают в свое распоряжение наиболее полный набор документов по быстрым реакторам.

В процессе приклепления дескрипторов к элементам тасономии за основу взяты сами элементы таксономии. В некоторых случаях применен морфологический анализ, анализ синтаксической структуры слов в словосочетании. Независимо от того, в какой форме употребляется слово в таксономии, я учитывала различные формы этого слова по правилам английского языка. В некоторых случаях элемент таксономии и ключевое слово полностью совпадает, в таком случае осуществляется поиск по точной словоформе.

В некоторых случаях я использовала синонимы – если список подходящих ключевых слов оказывался слишком мал или не содержал пододящих дескрипторов, я изменяла слово.

Для поиска необходимых дескрипторов я пользовалась оператором Like. Если слова в запросе заключить в кавычки и скобки, то это будет устойчивое словосочетание. Но такой поиск редко дает нужный результат. Поэтому если элемент таксономии состоял из нескольких слов, я разбивала его на отдельные слова. Далее, при помощи операторов ‘OR’ и ‘And’, комбинирования поисковых ограничений на ключевые слова и разбивания слов на отдельные слоформы с учетом их морфологического строения, я путем тщательного анализа полученных результатов отбирала дескрипторы, которые будут служить связующими звеньями между элементами таксономии и документами по быстрым реакторам. Путем различной комбинации слов в запросе я исключала некоторые документы, или наоборот, если какое-то определенное слово было необходимо, я добавляла его в запрос.

Очень часто в результате поиска я получалa ключевые слова, смысловое значение которых не отражало значение элемента таксономии, тогда я либо снижала требования к поиску, либо подбирала синонимы.

Для полноценного информационного поиска необходимо учитывать морфологию отдельных слов при присвоении дескрипторов элементам. Для этого мне было необходимо определять грамматические характеристики слов, иногда приводить их к определенной форме, получать определенные словоформы.

В ходе своей работы я использовала синтактико-семантический анализ дескрипторов с одной стороны и элементов таксономии с другой. Я учитывала смысловое значение элемента. Часто требовалось выявлять скрытые взаимосвязи между целевыми объектами (элементами таксономии) и семантической классификации отношений между ними и дескрипторами на основе смыслового и морфологического анализа.

Для точного присвоения дескрипторов к элементам таксономии необходимо было выявить ассоциативные связями между ними на основе грамматического и статистического анализа слов. Только точный анализ дескрипторов и определенные знания в области быстрых реакторов и структуре таксономии позволяет осуществлять данную процедуру. Так же иногда удавалось выявить скрытые взаимосвязи между элементами таксономии и дескрипторами.

Успешное и правильное присвоение дескрипторов элементам таксономии позволит в будущем анализировать тексты документов по БР и автоматически распознавать в них различные ключевые слова, и автоматически относить эти документы в определенные разделы таксономии. Область применения данной схемы включает не только область быстрых реакторов, но и другие области знаний ядерной энергетики, которые требуют сохранения и систематизации.

Специфика предметной области, в которой я работала, ребовала учитывать словоизменения большого количества слов (их морфологические особенности). В ходе своей работы мне приходилось анализировать смысловое значение слова. Это позволяло расширять запрос синонимичными, более общими и более частными понятиями.

Результаты

В таксономию по быстрым реакторам включено 73205 различных документов, касающихся технологий по быстрым реакторам. Каждый документ содержит около 9 различных ключевых слов, которые были ему приписаны специалистами в предметной области.

В результате проведённого анализа оказалось, что все документы содержат 721657 ключевых слов, но многие из них повторяются. В ходе проверки оказалось, что база данных документов содержит 13681 различных ключевых слов, что составляет примерно 2% от общего количества повторяющихся ключевых слов.

Далее я провела анализ элементов таксономии. Общее количество наименований в таксономии равняется 1994, но в связи с ее устройством многие из них повторяются. Различных элементов таксономии оказалось 441. Что составляет чуть больше 22% от общего количества элементов таксономии.

Рис. 7 - Исследование

Далее я разработала и описала подход к практическому применению метаданных документов, входящих в таксономию по быстрым реакторам, для международной системы организации знаний в области быстрых реакторов, и разработала наборы ключевых слов для каждого элемента таксономии с целью эффективного поиска документов при помощи таксономии по быстрым реакторам.


Заключение

В данной работе выделены и рассмотрены существующие национальные и международные программы, имеющие одним из своих направлений развитие технологий по быстрым реакторам. Однако охватить всю тематику накопленных научных и технических знаний они не в состоянии. Только совместными усилиями стран-разработчиков быстрых реакторов и при координирующей роли МАГАТЭ возможно обобщить и сохранить знания по технологии быстрых реакторов.

В работе подробно описана структура и устройство таксономии системы организации знаний по быстрым реакторам (СОЗ БР). Были описаны технические документы и метаданные технических документов по быстрым реакторам. В дипломной работе доказано, что таксономия знаний по быстрым реакторам, применяемая в СОЗ БР, является простым и наиболее удобным средством хранения, систематизации и поиска информации. Описана процедура добавления и поиска документов по таксономии.

Выпускная квалификацилнная работа явилась результатом проведённого анализа метаданных документов по быстрым реакторам. Был проведен анализ семантически идентичных групп элементов таксономии по быстрым реакторам и выявлен частотно-упорядоченный набор дескрипторов на основе тезауруса ИНИС, применяемый в анализируемых метаданных. Также были разработаны наборы ключевых слов для каждого элемента таксономии с целью дальнейшего эффективного поиска документов с помощью таксономии по быстрым реакторам.


Список литературы

1 International Atomic Energy Agency, International Project on Innovative Nuclear Reactors and Fuel Cycles (INPRO), 2008 Progress Report, IAEA, Vienna, 2008.

2 Международное состояние и перспективы ядерной энергетики, Доклад Генерального директора, GOV/INF/2008/10-GC(52)/INF/6, МАГАТЭ, 2008. – С. 34-35.

3  Кучеров Ю. Н. Энергетика. Проблемы и планы гиганта (по материалам “Наука и жизнь” http://www.nkj.ru/archive/articles/4859/)

4 В. М. Мурогов Ядерные технологии – гарант стабильности развития России http://www.perspektivy.info/rus/konturi/yad_tehnologii_garant_stabilnosty.htm

5 Куприянов В. М. Сохранение знаний в странах СНГ / В. М. Куприянов, А. В. Тюрин, Е. Н. Стулова // Безопасность окружающей среды. – 2007. - № 2. – С. 18-19.

6 Nuclear Energy Outlook 2008, OECD Nuclear Energy Agency, NEA No. 6348

7 International Atomic Energy Agency, Nuclear Power Reactors in the World, RDS No. 2, IAEA, Vienna, 2008.

8 МАГАТЭ о состоянии и перспективах атомной энергетики в мире (по материалам AtomInfo.Ru http://www.atominfo.ru/news/air6087.htm)

9 International Atomic Energy Agency, IAEA Fast Reactor Knowledge Preservation Initiative, Project Focus: KNK-II Reactor, Karlsruhe, Germany, IAEA, Vienna, 2004.

10  Щедровицкий П. Г. России нужны новые ядерщики // Безопасность окружающей среды. – 2007. – № 2. – С. 12-13.

11 International Atomic Energy Agency, Nuclear Technology Review 2008, IAEA, Vienna, 2008 – С. 95-96.

12 Ринейский А. А. Инжиниринг энергоблока с реактором на быстрых нейтронах БН-800: сравнение с мировыми аналогами // Атомные технологии. – 2008.

13  International Atomic Energy Agency, Fast Reactor Database 2006 Update, IAEA-TECDOC-1531, IAEA, Vienna, 2006.

14 Медовников Д. М. Бридерные технологии (по материалам журнала “Эксперт” http://www.expert.ru/printissues/expert/2001/21/21ex-nauka/)

15  International Atomic Energy Agency, Managing Nuclear Knowledge, IAEA Activities and International Coordination, IAEA, Vienna, 2005.

16 Харитонов В. В. Время единения // Безопасность окружающей среды. – 2007. - № 2. – С. 14-15.

17 А. С. Пряхин Пилотная эксплуатация Системы Организации Знаний по Быстрым Реакторам

(по материалам AtomInfo.Ru http://www.atominfo.ru/news/air5369.htm)

18 International Atomic Energy Agency, GC(47)/RES/10 (Strengthening of the Agency’s Activities Related to Nuclear Science, Technology and Applications), Part B: Nuclear Knowledge, IAEA, Vienna, 2003.

19 Pryakhin A. Fast Reactor Knowledge Inventory / A. Pryakhin, A. Stanculescu, Y. Yanev, 2009.

20 International Nuclear Information System and Nuclear Knowledge Management

(сайт МАГАТЭ http://www.iaea.org/inisnkm/)

21 Fast Reactors and Accelerator Driven Systems Knowledge Base (сайт МАГАТЭ http://www.iaea.org/inisnkm/nkm/aws/fnss/auxiliary/iaea.html)

22  International Atomic Energy Egency, Nuclear I nformation and Knowledge, News from the INIS and Nuclear Knowledge Management Section, Vienna, 2006

23 Zoltan Pasztory, Developments in Knowledge Management, IAEA Technical Working Group on Nuclear Power Plant Personnel Training and Qualification, Vienna, May 2008.

24 Мурогов В. М. Интеллектуальные ресурсы – самые ценные // Безопасность окружающей среды. – 2007. - № 2. – С. 22-23.

25 International Atomic Energy Agency, Fast Reactor Knowledge Preservation System: Taxonomy and Basic Requirements, IAEA Nuclear Energy Series, No. NG–T-6.3, Vienna, 2008.

26 International Atomic Energy Agency, Presenting INIS, IAEA, Vienna, 2005.

27 Web Harvesting for Nuclear Knowledge Preservation, Nuclear Energy Series No. NG-T-6.6 STI/PUB/1314, ISBN 978–92–0–111207–1, January 2008.

28 Risk Management of Knowledge Loss in Nuclear Industry Organizations, IAEA Publications STI/PUB/1248, 2006.


Глоссарий

Generation-IV – the Generation IV International Forum – Международный Форум Четвертое Поколение

GNEP – the Global Nuclear Energy Partnership - Инициатива Соединенных Штатов Америки: Глобальное Партнерство Ядерной Энергии

IAEA (МАГАТЭ) – Международное агентство по атомной энергии

INIS (ИНИС) – International Nuclear Information System- Международная Система по ядерной информации

INPRO - Международный Проект МАГАТЭ по Инновационным Ядерным Реакторам и Топливным Циклам

БР – быстрый реактор

Дескриптор – лексическая единица информационно-поискового языка, служащая для описания основного смыслового содержания документов

Ключевое слово – как и дескриптор, обозначает класс, в котором потенциально находятся все тексты, включающие это слово как элемент основного смыслового содержания

Метаданные - данные, представляющие собой характеристики описываемых сущностей для целей их поиска, оценки, управления ими

МОКС топливо – оксидное уран-плутониевое топливо

ОЯТ – отработавшее ядерное топливо

Семантика – определяет смысловое значение предложений и слов. Семантическая паутина – часть глобальной концепции развития сети Интернет, целью которой является возможность машинной обработки информации. Основной акцент концепции делается на работе с метаданными.

СОЗ БР – Система Организации Знаний по быстрым реакторам

Таксономия – иерархическая модель знаний, использующаяся, чтобы систематизировать имеющуюся информацию и помочь пользователю в ее поиске

Тезаурус – особая разновидность словарей, в которых указаны семантические отношения между лексическими единицами


Повреждений, вызванных в живом организме излучением