Также по теме

ИНФОРМАЦИИ НАКОПЛЕНИЕ И ПОИСК

ИНФОРМАЦИИ НАКОПЛЕНИЕ И ПОИСК. Информация является одной из основных потребностей современного человека; она нужна для работы, путешествий, приобретения товаров, принятия решений, выполнения школьных заданий, заботы о здоровье и многочисленных других видов деятельности. Человеческий мозг наделен удивительной эффективностью в отношении накопления и поиска информации. Однако в 20 в. информация накапливается человечеством такими темпами, что без специальных технических средств человеку и даже организации становится все труднее справиться с поиском необходимых данных.

Системы накопления и поиска информации собирают, анализируют, организуют, хранят, отыскивают и распространяют информацию. Традиционно много существующей информации было записано на бумаге, накапливалось в библиотеках и информационных центрах и отыскивалось вручную. С середины 1960-х годов для автоматического накопления и поиска информации начали использоваться различные механические и электронные помощники. Такие системы могут обрабатывать сотни миллионов элементов информации и отыскивать отдельные элементы практически мгновенно.

Компьютер и электронные средства связи составляют ядро современных систем накопления и поиска информации. Например, через настольный компьютер или другой терминал можно получить по телефону доступ к файлам местного или удаленного информационного центра и автоматически найти нужную информацию. Виды деятельности, требующие использования бумаги, такие, как чтение газет, написание писем и банковское дело, со временем будут заменены их электронными эквивалентами.

ТИПЫ ИНФОРМАЦИОННЫХ СИСТЕМ

Существуют три основных типа информационных систем: системы управления базами данных, системы поиска библиографических ссылок и запросно-ответные системы.

Системы управления базами данных.

Управление базой данных имеет дело с обработкой простых файлов (типа обычно используемых в бизнесе). Каждый файл содержит записи того или иного вида, например, информацию о служащих или о различных товарах на складе. Каждая запись, в свою очередь, хранит конкретную информацию; например, служащий может идентифицироваться по имени, адресу, специальности и зарплате. Таким образом, файл базы данных может быть представлен таблицей, строки которой содержат индивидуальные записи, а столбцы – конкретные данные, относящиеся к ним. Тогда управление базой данных состоит в установлении связей таблиц и записей для конкретных целей. Например, системы управления базами данных могут определять, сколько служащих, имеющих возраст 35 и более лет, выполняет определенные виды работ.

Системы поиска библиографических ссылок.

Эти системы обычно имеют дело с текстом, например названиями и аннотациями книг и статей, и осуществляют поиск ссылок на элементы конкретной предметной области, хранимой в библиотечном файле. Например, пользователь мог бы запросить все библиографические ссылки по теме «Проектирование современных систем поиска информации». Чтобы идентифицировать отдельные ссылки, сначала должно быть задано содержание упомянутых элементов в файле. Следовательно, анализ содержания, или индексация, играет важную роль в системах поиска ссылки. Кроме того, поскольку библиографические файлы могут содержать миллионы элементов, обязательно должен быть обеспечен быстрый доступ к каждому из них. Поэтому особую важность приобретают эффективные методы поиска файлов. Запросы и ответы во многих случаях выражаются на естественном, а не на машинном (компьютерном) языке.

Запросно-ответные системы.

Эти системы дают прямой ответ на запрос, формулируемый обычно на естественном языке. Запросно-ответные системы соединяют в себе характеристики как систем управления базами данных, так и систем библиографического поиска. Поскольку ответ на запрос, относящийся к фактам, дается напрямую, то запросно-ответная система нуждается в знании соответствующих приемов и методов лингвистики, в подробной информации о конкретных областях деятельности, а также в запасе общих знаний. По этой причине такие системы используются только в особых обстоятельствах и в определенных предметных областях.

ПРОЦЕСС НАКОПЛЕНИЯ И ПОИСКА ИНФОРМАЦИИ

В принципе запрос на информацию можно было бы сравнить с содержимым файлов и выявить наилучшее соответствие. На практике, однако, содержание как запроса, так и элементов хранимой информации надо сначала определить более четко. Таким образом, в управлении базой данных содержание каждой записи оценивается согласно некоторому масштабу значений; в системе поиска ссылки документ представляется набором терминов, каждый из которых имеет значение (вес), зависящее от важности термина в документе.