ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.12.2020

Просмотров: 1763

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

392

созданная

 

в

 1994 

году

 

докторантами

 

Стенфордского

 

университета

Джерри

 

Янгом

 (Yang, Jerry) 

и

  

Дэвидом

 

Фило

 (Filo, David). 

Назва

-

ние

 Yahoo 

является

 

сокращением

 

целой

 

фразы

 «Yet Another

Hierarchical Officious Oracle – 

Еще

 

один

 

иерархический

 

дружествен

-

ный

 

путеводитель

». 

Эта

 

система

 

выросла

 

из

 

коллекции

 

интернет

-

ссылок

которую

 

разработчики

 

составили

 

для

 

своих

 

диссертаций

.

Когда

 

список

 

стал

 

слишком

 

большим

 

и

 

необозримым

они

 

разбили

его

 

на

 

несколько

 

рубрик

Когда

 

рубрики

 

выросли

 

в

 

объеме

их

 

раз

-

делили

 

на

 

подрубрики

 

и

 

т

д

., 

так

 

родилась

 

будущая

 

всемирно

 

изве

-

стная

 

система

Система

 

была

 

установлена

 

на

 

личных

 

компьютерах

авторов

слух

 

о

 

ней

 

распространился

 

среди

 

знакомых

 

и

 

друзей

к

ней

 

постепенно

 

стало

 

обращаться

 

все

 

больше

 

и

 

больше

 

интернет

-

посетителей

Когда

 

к

 

осени

 1994 

года

 

был

 

зарегистрирован

 

первый

миллион

 

посещений

друзья

 

поняли

что

 

в

 

их

 

руках

 

находится

 

по

-

тенциальный

 

бизнес

Весной

 1995 

года

 

с

 

помощью

 

инвесторов

 

были

собраны

 2 

миллиона

 

долларов

 

и

 

образована

 

компания

 Yahoo! Inc.

со

 

штаб

-

квартирой

 

в

 

местечке

 

Сан

 

Вэлли

 

в

 

Кремниевой

 

долине

.

Уже

 

к

 1997 

фирма

 

имела

 

доход

 67 

млн

 

долларов

 

и

 

вошла

 

в

 

список

200 

крупнейших

 

сетевых

 

компаний

,. 

в

 

настоящее

 

время

 

ее

 

услуга

-

ми

 

ежегодно

 

пользуются

 237 

миллионов

 

человек

адрес

www.yahoo.com 

является

 

одним

 

из

 

самых

 

популярных

 

в

 

интернете

.

Компания

 

не

 

только

 

ведет

 

гигантский

 

каталог

 

по

 HTML-

страни

-

цам

но

 

обеспечивает

 

множество

 

других

 

интернет

-

услуг

полнотек

-

стовый

 

поиск

электронную

 

коммерцию

интернет

-

вещание

 

и

 

др

.

Поисковые

 

системы

В

 

отличие

 

от

 

интернет

-

каталогов

поисковые

 

системы

 

систематизируют

 

данные

 

в

 

автоматическом

режиме

День

 

и

 

ночь

 

программы

-

роботы

называемые

 

пауками

(spider)

 

ползают

 

по

 

Всемирной

 

паутине

заглядывая

 

во

 

все

 

ее

 

уголки

и

 

составляя

 

списки

 

просмотренных

 Web-c

траниц

Текст

 

каждой

страницы

 

анализируется

 

с

 

целью

 

выявления

 

значащих

 

слов

 (

то

 

есть

всех

 

встречающихся

 

в

 

документе

 

слов

за

 

исключением

 

артиклей

,

предлогов

 

и

 

наиболее

 

употребительных

 

слов

ничего

 

не

 

говорящих

о

 

содержании

 

текста

встречающихся

 

на

 

данной

 

странице

На

 

основе

этого

 

анализа

 

автоматически

 

составляется

 

полнотекстовый

 

индекс

(full-text index), 

в

 

котором

 

для

 

каждого

 

слова

 

перечислены

 

адреса


background image

393

страниц

где

 

это

 

слово

 

встречается

Когда

 

пользователь

 

передает

поисковой

 

системе

 

запрос

представляющий

 

собой

 

список

 

ключевых

слов

 (keywords)

эти

 

слова

 

сопоставляются

 

с

 

индексом

 

и

определяются

 Web-

страницы

релевантные

 (relevant)

то

 

есть

соответствующие

 

запросу

Реальные

 

алгоритмы

 

установления

степени

 

релевантности

 

очеь

 

сложны

они

 

учитывают

 

не

 

только

 

факт

наличия

 

ключевого

 

слова

 

в

 

документе

но

 

и

 

его

 

место

 (

наиболее

важные

 

слова

 

обычно

 

располагаются

 

в

 

заголовке

 

или

 

в

 

начале

документа

), 

частоту

 

встречаемости

 

и

 

др

Эти

 

алгоритмы

 

основаны

на

 

самых

 

последних

 

достижениях

 

в

 

области

 

лингвистики

,

метематической

 

логики

 

и

 

теории

 

искусственного

 

интеллекта

,

обычно

 

они

 

запатентованы

 

или

 

составляют

 

производственный

секрет

 (know-how) 

данной

 

поисковой

 

системы

.

В

 

свете

 

сказанного

 

ясно

что

 

промышленная

 

полнотекстовая

поисковая

 

система

обслуживающая

 

всемирный

 

интернет

,

представляет

 

собой

 

мощнейший

 

программно

-

аппаратный

 

комплекс

,

создать

 

который

 

под

 

силу

 

лишь

 

крупной

 

компании

Первой

 

такой

системой

 

была

 AltaVista – «

взгляд

 

сверху

», 

созданная

 

в

 1995 

году

фирмой

 Digital Equipment 

с

 

целью

 

демонстрации

 

возможностей

своих

 

компьютеров

Система

 

работает

 

на

 

самых

 

мощных

компьютерах

произведенных

 

компанией

 – 

это

 16 

серверов

Alphaserver 8400, 

объединенных

 

в

 

кластер

Каждый

 

из

 

серверов

имеет

 8 

Гбайт

 

оперативной

 

памяти

содержит

 12 RISC-

процессоров

Digital Alfa, 

в

 

качестве

 

жестких

 

дисков

 

используются

высокоскоростные

 

и

 

надежные

 

дисковые

 

системы

 

общим

 

объемом

,

измеряемым

 

терабайтами

 (1 

Тбайт

=1000 

Гбайт

). 

Полнотекстовый

индекс

 

системы

 

содержит

 

информацию

 

о

 550 

миллинах

 Web-

страниц

 

на

 20 

национальных

 

языках

включая

 

русский

японский

,

китайский

 

и

 

корейский

Более

 

того

обеспечивается

 

автоматический

перевод

 

результатов

 

поиска

 

на

 

многие

 

языки

  (

к

 

сожалению

русского

среди

 

них

 

пока

 

нет

). 

Производительность

 

системы

 

такова

что

,

обрабатывая

 

одновременно

 

множество

 

запросов

 

со

 

всего

 

света

она

обеспечивает

 

время

 

ответа

 

порядка

 0,4-0,5 

с

.

Новейшие

 

научные

 

достижения

 

в

 

области

 

мультимедиа

позволили

 

поисковым

 

системам

 

индесировать

 

не

 

только

 

тексты

но


background image

394

и

 

встроенные

 

в

 Web-c

траницы

 

изображения

звуковые

 

и

видеофайлы

Например

, c

оответствующий

 

индекс

 AltaVista

учитывает

 

более

 90 

миллионов

 

мультимедиа

-

объектов

.

Вслед

 

за

 AltaVista 

в

 

интернете

 

появились

 

конкурирующие

поисковые

 

истемы

: Lycos, WebCrawler (

от

 crawle – 

ползать

),

InfoSeek, Google 

и

 

ряд

 

других

поисковую

 

услугу

 

ввела

 

и

 

фирма

Yahoo. 

По

-

видимому

 

самым

 

большим

 

полнотекстовым

 

индексом

располагает

 Lycos, 

уже

 

в

 1996 

году

 

его

 

объем

 

превышал

 4 

терабайта

.

Российские

 

поисковые

 

системы

 

если

 

не

 

по

 

объему

то

 

по

 

качеству

поиска

 

не

 

уступают

 

западным

И

 

хотя

 

наличие

 

флексий

 (

изменяемых

частей

 

слова

в

 

русском

 

языке

 

существенно

 

усложняет

   

задачу

построения

 

полнотекстовых

 

индексов

накопленный

 

отечественной

наукой

 

опыт

 

построения

 

библиографических

 

информационно

-

поисковых

 

систем

 

позволил

 

создать

 

мощные

 

и

 

удобные

 

в

использовании

 

поисковые

 

системы

самыми

 

известными

 

из

 

которых

являются

  

Я

ndex, Rambler 

и

 Aport.

Социальные
и

 

экономические

последствия
интернет

-

революции

Предельная

 

легкость

интуитивная

понятность

 

и

 

универсальность

 Web-

интерфейса

наличие

 

в

 

Сети

 

разви

-

тых

 

средств

 

поиска

 

сделали

 

интер

нет

 

к

 

началу

 XXI 

века

 

универсальной

информационно

-

коммуникационной

  

средой

 

и

 

мощным

 

средством

ускорения

 

информационной

 

революции

о

 

которой

 

мы

 

говорили

 

в

самом

 

начале

 

этой

 

книги

И

 

хотя

 

сетевые

 

технологии

 

продолжают

бурно

 

развиваться

предлагая

 

пользователям

 

все

 

новые

 

и

 

новые

 

вы

-

сокоуровневые

 

услуги

 

и

 

соответствующие

 

им

 

протоколы

уже

 

сей

-

час

 

ясно

что

 

компьютерные

 

сети

 

изменили

 

мир

 

не

 

в

 

меньшей

 

сте

-

пени

чем

 

сами

 

компьютеры

Билл

 

Гейтс

хоть

 

и

 

с

 

опозданием

но

все

 

же

 

оценивший

 

роль

 

информационных

 

сетей

 

в

 

современном

мире

высказался

 

очень

 

образно

 

и

 

точно

: «

Интернет

 

завтра

 

будет

тем

чем

 

сегодня

 

является

 

автомобиль

».

Последствия

 

этого

 

феномена

его

 

влияние

 

на

 

социальнцю

 

сфе

-

ру

 – 

науку

культуру

образование

здравоохранение

, –  

а

 

также

 

на

всю

 

мировую

 

экономику

,  

еще

 

предстоит

 

осмыслить

 

и

 

оценить

По

этому

 

поводу

 

написана

 

не

 

одна

 

книга

 

и

 

будет

 

написано

 

еще

 

очень


background image

395

много

недаром

 

в

 

ряде

 

вузов

в

 

частности

в

 

Томском

 

государстве

-

ноом

 

университете

создаются

 

кафедры

 

гуманитарных

 

проблем

 

ин

-

форматики

В

 

данном

 

разделе

 

мы

 

лишь

 

упомянем

 

некоторые

уже

очевидные

 

результаты

 

продолжающейся

 

интернет

-

революции

.

Средства

 

массовой

 

информации

.

 

Глобальная

 

телекоммуни

-

кационная

 

система

 

в

 

корне

  

меняет

 

деятельность

 

средств

 

массо

-

вой

 

информации

На

 

смену

 

бумажным

 

газетам

 

и

 

журналам

 

при

-

ходят

 

электронные

обычное

 

радиовещание

 

и

 

телевидение

пока

уступающее

 

сетевому

 

из

-

за

 

низкой

 

пропускной

 

способности

 

ка

-

налов

 

связи

будет

 

неизбежно

 

вытесняться

 «

видео

 

по

 

требова

-

нию

», 

а

 

домашние

 

телевизоры

 

будут

 

снабжены

 

интернет

-

при

-

ставками

В

 

этой

 

перспективе

 

вполне

 

логичными

 

являются

 

дей

-

ствия

 

крупнейших

 

медиа

-

компаний

направленные

 

на

 

глубокую

интеграцию

 

традиционных

 

и

 

перспективных

 

средств

 

массовой

информации

Например

в

 2001 

году

 

весь

 

мир

 

был

 

свидетелем

рекордной

 

по

 

масштабам

 (

более

 120 

миллиардов

 

долларов

сдел

-

ки

 

между

 

крупнейшим

 

интернет

-

провайдером

 America On-Line

и

 

газетно

-

телевизионной

 

империей

 Time Warner, 

которой

 

при

-

надлежит

среди

 

прочих

знаменитый

 

круглосуточный

 

новостной

канал

 CNN. 

В

 

результате

 

их

 

слияния

 

образовался

 

медиа

-

гигант

с

 

годовым

 

доходом

 

более

 40 

млрд

долларов

знаменующий

 

но

-

вый

 

уровень

 

информационных

 

технологий

 

в

 XXI 

веке

.

Образование

 

и

 

культура

.

 

Интенсивное

 

накопление

 

в

 

Сети

 

по

-

знавательных

 

и

 

информационных

 

ресурсов

 (

учебных

научных

 

и

художественных

 

книг

справочников

электронных

 

копий

 

произве

-

дений

 

изобразительного

 

искусства

музыкальных

 

записей

 

и

 

т

д

.)

может

 

принципиальным

 

образом

 

изменить

 

систему

 

профессиональ

-

ного

 

и

 

эстетического

 

образования

Для

 

нашей

 

безбрежной

 

страны

это

 

важно

 

вдвойне

так

 

как

 

с

 

помощью

 

интернета

 

сокровища

 

миро

-

вой

 

науки

 

и

 

культуры

 

становятся

 

доступными

 

не

 

только

 

обитате

-

лям

 

больших

 

городов

 

с

 

их

 

музеями

 

и

 

библиотеками

но

 

и

 

жителям

самых

 

отдаленных

 

селений

которые

 

можно

 

подключить

 

к

 

инфор

-

мационным

 

магистралям

 

по

 

спутниковым

 

радиолиниям

 

типа

DirecPC. 

Тем

 

самым

 

складываются

 

благоприятные

 

условия

 

для

 

пре

-


background image

396

доставления

 

населению

 

новых

 

видов

 

образовательных

 

услуг

В

 

ча

-

стности

в

 

последние

 

годы

 

очень

 

активно

 

развивается

 

система

 

дис

-

танционного

 

обучения

дающая

 

возможность

 

получить

 

професси

-

ональное

 

образование

 

в

 

лучших

 

вузах

 

страны

 

независимо

 

от

 

места

жительства

.

Здравоохранение

Список

 

социальных

 

последствий

 

интер

-

нет

-

революции

 

можно

 

продолжать

 

еще

 

долго

мы

 

упомянем

 

еще

лишь

 

одну

но

 

важную

 

тему

 – 

телемедицину

Речь

 

идет

 

о

 

воз

-

можности

 

получения

 

по

 

интернету

 

консультаций

 

в

 

режиме

 on-

line 

у

 

ведущих

 

специалистов

находящихся

 

на

 

расстоянии

 

тысяч

километров

 

от

 

постели

 

больного

то

 

есть

 

о

 

создании

 

некоторого

виртуального

 

госпиталя

Работники

 

здравоохранения

 

считают

это

 

направление

 

исключительно

 

перспективным

именно

 

поэто

-

му

 

американский

 

проект

 

интернета

 

нового

 

поколения

 NGI, 

о

котором

 

мы

 

уже

 

упоминали

,  

в

 

значительной

 

степени

 

ориенти

-

рован

 

на

 

задачи

 

телемедицины

.

Не

 

менее

 

значительным

 

является

 

влияние

 

интернет

-

революции

на

 

экономику

На

 

рисунке

 

в

 

схематической

 

форме

 

представлены

 

ос

-

новные

 

связи

 

некоторого

 

хозяйствующего

 

субъекта

 (Business) c 

соб

-

ственными

 

работниками

 (Employee), 

покупателями

 

и

 

клиентами

(Customer, Client), 

другими

 

субъектами

 

бизнеса

а

 

также

 

правитель

-

ственными

 

учреждениями

 (Government). 

Для

 

обозначения

 

этих

 

свя

-

зей

 

в

 

современном

 

компьютерном

 

жаргоне

 

используются

 

специфи

-

ческие

 

сокращения

 

вроде

 B2B, 

которое

 

получилось

когда

 

во

 

фразе

Business to Business 

предлог

 «to» 

изменили

 

на

 

аналогичное

 

по

 

зву

-

чанию

 

числительное

 «two», 

а

 

потом

 

на

 

цифру

 2. 

С

 

появлением

 

об

-

щедоступной

надежной

 

и

 

защищенной

 

мировой

 

телекоммуника

-

ционной

 

системы

 

эти

 

сложившиеся

 

десятилетиями

 

традиционные

связи

 

приобретают

 

новые

 

формы

появляются

 

невиданные

 

доселе

возможности

.

B2E (

бизнес

 – 

работник

).

 

Всегда

 

считалось

 

непреложной

 

ис

-

тиной

что

 

работник

 

не

 

только

 

физического

но

 

и

 

творческого

 

труда

должен

 

находиться

 

на

 

своем

 

предприятии

 «

от

 

звонка

 

до

 

звонка

»,

только

 

там

 

он

 

мог

 

общаться

 

с

 

коллегами

получать

 

задания

 

и

 

отчи

-