WIN - KOI - DOS - ISO - MAC - LAT



11(50) '98 Компьютеры + Программы
(популярный журнал
о современных
информационных технологиях

Конференции UseNet: средства доступа и автоматического поиска

ГУСАК Олег Юрьевич,
аспирант кафедры
компьютерных наук
университета Билькент, Турция.
e-mail: gusak@cs.bilkent.edu.
tr http://www.cs.bilkent.edu.tr/~gusak

НЕОБЪЯТНЫЙ МИР ИНТЕРНЕТ НЕ ПЕРЕСТАЕТ УДИВЛЯТЬ НАС СВОЕЙ МНОГОЛИКОСТЬЮ. ОДНИМ ИЗ ЕГО ПРОЯВЛЕНИЙ, В ПОСЛЕДНЕЕ ВРЕМЯ ОСТАВЛЕННЫМ ПРЕССОЙ БЕЗ ВНИМАНИЯ, ЯВЛЯЮТСЯ ГРУППЫ USENET, ОБЛАДАЮЩИЕ КАК УНИКАЛЬНЫМИ ИНФОРМАЦИОННЫМИ РЕСУРСАМИ, ТАК И СРЕДСТВАМИ ИХ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ И ПОИСКА.



РАБОТА С СЕРВЕРОМ Reference.com в режиме off-line

Взаимодействие с сервером Reference.corn в режиме off-line осуществляется посредством ; адреса <Email-Queriens@Reference.COM>. Как и в режиме on-line, сервер принимает и обрабатывает запросы двух видов - простые и сложные. Первый вид запросов позволяет вам на основании заданных ключевых слов провести поиск в базе данных сервера. Во втором случае: первоначально формируется шаблон запроса, который потом может быть использован как для одноразового поиска, так и для поиска в автоматическом режиме. В ответ на получаемые запросы сервер предоставляет вам список конференций, соответствующих условиям вашего поиска. Каждая конференция, приведенная в списке, имеет свой уникальный номер, используя, который вы можете заказать полный вариант той или иной статьи.

Режим простых запросов
Простые запросы не требуют регистрации пользователя, выполняются сервером однократно и представляют собой набор команд, помещаемых в текст письма (при этом каждая такая, команда должна начинаться с новой строки). Все строчки заголовка письма, кроме поля From, игнорируются. Если ваша почтовая программа автоматически добавляет к письму файл вашей подписи, последней строкой пакета запросов должно быть ключевое слово END, сигнализирующее серверу об окончании блока команд.

Для осуществления простого поиска необходимо сформировать запрос, состоящий из ключевого слова FIND и следующего за ним условия поиска. Так, например, для того, чтобы найти сведения о выпуске Windows 98, необходимо отправить запрос вида:

FIND Windows98

Заметим, что в данном запросе ключевое слово интерпретируется сервером как подстрока, то есть сервер осуществляет неточный поиск. Если вы, к примеру, задали для поиска ключевое слово network, оно будет соответствовать словам network, networks, networking и так далее.

Для осуществления точного поиска ключевое слово необходимо заключить в двойные кавычки, или <лапочки>, например:

FIND "network"
Для поиска фразы, состоящей из нескольких слов. разделенных пробелами, необходимо использовать одинарные кавычки (т.е. открывающий и закрывающий апострофы):

FIND 'audio driver'

В противном случае - если кавычки опущены, - сервер будет интерпретировать данную последовательность слов как логическое выражение, в котором слова разделены оператором <ИЛИ>. Для построения сложных запросов допускается использовать логические операторы AND. OR, NOT. Так, например, для поиска информации по сетевому программному обеспечению, выпускаемому любыми фирмами, кроме Microsoft, можно использовать запрос вида:

FIND network AND software NOT Microsoft

Отметим, что абсолютно все слова, следующие за оператором NOT рассматриваются как отрицание, и использование каких-либо логических операторов после первого NOT не имеет смысла. Так, запрос вида

FIND networking AND NOT Microsoft OR Novell

приведет к отрицанию документов, содержащих слова Microsoft или Novell. Для формирования запросов можно использовать и круглые скобки.

Кроме поиска документов по их содержимому можно также производить отбор статей по времени их создания. Так, запрос для поиска публикаций, вышедших за последние два дня. будет иметь следующий вид:

FIND Windows98 WHERE AGE < 2 DAYS

В качестве операторов сравнения допускается использовать следующие комбинации символов: =, <, >. <=, >=. В качестве единицы времени можно также применять ключевые слова WEEKS и MONTHS, например:

FIND 'Outlook express' WHERE AGE = 2 MONTHS

В качестве дополнительных фильтров поиска можно использовать такие ключевые слова, как SUBJECT, GROUP, ORGANIZATION, KEYWORDS, которые позволяют сузить границы поиска до соответствующих полей заголовков публикуемых документов. Так, например, чтобы узнать отзывы служащих Microsoft о ее программном продукте, можно сформировать запрос следующего вида:

FIND Windows98 WHERE ORGANIZATION CONTAINS Microsoft

Для получения списка статей, опубликованных в определенной конференции, например, соmр.mail.uucp, необходимо составить запрос вида:

FIND WHERE GROUPS CONTAINS comp.mail.uucp

Для поиска статей по полю <From:> заголовка письма предусмотрены следующие ключевые слова:

NAME- с его помощью задается поиск на полное совпадение информации, содержащейся в поле <From:>;

LOGIN - позволяет выделить из адреса пользователя его имя;

HOST- ведет поиск на совпадение имени домена пользователя, отправившего данное письмо.

Так, ранее рассмотренный пример с поиском публикаций персонала фирмы Microsoft может быть представлен в следующем виде:

FIND Windows98 WHERE HOST CONTAINS microsoft.com

Наряду с операторами поиска сервер содержит команды, позволяющие управлять режимом выдачи результатов. Так, по умолчанию при ответе на запрос пользователя в файл результатов записываются первые 10 строк каждой найденной статьи. Для задания своего собственного значения, например 15 строк, необходимо сформировать запрос вида:

FIND DISPLAY 15 LINES <строка запроса>

Допустимый диапазон выдаваемого числа строк находится в пределах 0-99.

Для контроля за числом возвращаемых документов необходимо воспользоваться следующим запросом:

FIND DISPLAY 100 HITS <строка запроса>

По умолчанию число возвращаемых документов равно 25. Допустимый диапазон для данной переменной 1-200.

Как было отмечено выше, найденные статьи приводятся в ответе сервера под уникальными номерами. Для получения же полного текста документа необходимо направить серверу команду

GET <номер статьи>

Данная команда допускает указание более одного номера документа, при этом последние разделяются пробелами.

Работа с профайлами
Рассмотренный выше режим простых запросов предполагает формирование и ручное выполнение запросов каждый раз при необходимости поиска информации. Для упрощения и автоматизации данной процедуры (по аналогии с on-line режимом работы с сервером) существует механизм профайлов. Прежде чем получить возможность работать в данном режиме, пользователь должен зарегистрироваться, то есть сформировать на сервере учетную запись, состоящую из имени и пароля. Как и в интерактивном режиме работы с сервером, в качестве имени пользователя применяется почтовый адрес. Так, для создания нового профайла необходимо отправить на сервер команду:

REGISTER newuser@domain.comn PASSWORD mypassword

Впоследствии, при каждом обращении к серверу в режиме сложных запросов, например при настройке профайла пользователя, выполнении сохраненных ранее шаблонов поиска (см. далее) вам необходимо будет указывать эти данные в команде USER:

USER newuser@domain.com PASSWORD mypassword

Отметим, что если команды отправляются с адреса, который является вашим регистрационным именем на сервере, ключевое слово USER и его значение могут быть опущены (сервер будет автоматически использовать данные поля <From:> заголовка письма). Кроме того, строка <USER... PASSWORD" должна обязательно присутствовать в каждом письме, направляемом к серверу в режиме сложных запросов, и быть самой первой строкой такого письма.

При необходимости изменить пароль либо при смене вашего почтового адреса можно воспользоваться командами ALTER USER PASSWORD и ALTER USER NAME соответственно. Так, полная процедура изменения пароля для вышеуказанного пользователя выглядит следующим образом:

USER newuser@domain .corn PASSWORD mypassword ALTER USER PASSWORD newpassword

Формат возвращаемых писем выбирают с помощью команды ALTER USER OUTPUT, предоставляющей выбор из трех параметров: HTML, DIGEST, PLAIN. Они <побуждают> сервер отправлять результаты поиска в формате MIME с типом данных, соответственно, text/html, multipart/digest, text/plain. Тал, например, если вы пользуетесь HTML-совместимой почтовой программой (Netscape Mail, Internet Mail, Outlook Express и т. д.), можно настроить ваш профайл на получение писем в формате text/html:

ALTER USER OUTPUT HTML

По аналогии с простыми запросами можно также настроить свой профайл на получение определенного числа строк из каждого найденного письма- командой ALTER USER DISPLAY N LINES, где N - задаваемое число строк. В этом случае данное правило будет применено ко всем запросам, направляемым к серверу.

Основной целью упомянутых профайлов является хранение заранее созданных шаблонов поиска, специфических для каждого пользователя. Каждый такой шаблон состоит из его имени и параметров поиска. Общий формат определения шаблона запроса имеет следующий вид:

DEFINE QUERY <имя шаблона> AS FIND <строка запроса>

Так, например, для того чтобы определить запрос, по которому вы сможете в дальнейшем отслеживать информацию о новых версиях Netscape Communicator, необходимо отправить на сервер письмо вида:

DEFINE QUERY netcom AS FIND 'Netscape Communicator' AND 'new version'

Отметим, что в поле FIND запрос формируется в соответствии с правилами построения простых запросов.

Поле этого вы сможете в любой момент выполнить данный запрос, отправив команду вида:

RUN QUERY netcom

Если вы хотите непрерывно получать сведения по данному запросу, отправьте команду:

RUN QUERY netcom EVERY 3 DAYS FOR 2 MONTHS

которая приведет к автоматическому выполнению шаблона <netcom> каждые три дня в течение двух месяцев. Если ключевое слово EVERY опущено, сервер -будет производить выполнение данного запроса каждый день в течение указанного периода времени.

Для того чтобы прекратить работу данного запроса до истечения двух месяцев, необходимо передать серверу команду:

DEACTIVATE QUERY netcom

При этом сам шаблон продолжает храниться на сервере.

Для настройки числа выдаваемых строк найденных статей для каждого шаблона в отдельности можно воспользоваться командой:

ALTER QUERY netcom DISPLAY 50 LINES

Аналогичным образом производится настройка числа выдаваемых документов (ALTER QUERY <имя шаблона> DISPLAY <число документов> HITS).

Для просмотра созданных шаблонов и для их удаления используются команды SHOW QUERY <имя шаблона> и DROP QUERY <имя шаблона> соответственно.

Чтобы просмотреть текущие параметры вашего профайла. а также для; удаления последнего необходимо отразить на сервер команды SHOW USER и DROP USER соответственно.


ПОМНИТЕ, что сформировав однажды шаблон запроса и сохранив его в профайлe пользователя, вы сможете автоматически получать результаты поиска по e-mail.



Логотип - Начало - Общие сведения - Структура - Научная деятельность
Информационные ресурсы - Новости - Поиск по серверу - Карта сервера

поиск по серверу

5358 посещений с 25.07.1999
Последнее изменение 04.05.1999

(c) Institute of Biology, 1999