ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 16.12.2020
Просмотров: 1763
Скачиваний: 1
392
созданная
в
1994
году
докторантами
Стенфордского
университета
Джерри
Янгом
(Yang, Jerry)
и
Дэвидом
Фило
(Filo, David).
Назва
-
ние
Yahoo
является
сокращением
целой
фразы
«Yet Another
Hierarchical Officious Oracle –
Еще
один
иерархический
дружествен
-
ный
путеводитель
».
Эта
система
выросла
из
коллекции
интернет
-
ссылок
,
которую
разработчики
составили
для
своих
диссертаций
.
Когда
список
стал
слишком
большим
и
необозримым
,
они
разбили
его
на
несколько
рубрик
.
Когда
рубрики
выросли
в
объеме
,
их
раз
-
делили
на
подрубрики
и
т
.
д
.,
так
родилась
будущая
всемирно
изве
-
стная
система
.
Система
была
установлена
на
личных
компьютерах
авторов
,
слух
о
ней
распространился
среди
знакомых
и
друзей
,
к
ней
постепенно
стало
обращаться
все
больше
и
больше
интернет
-
посетителей
.
Когда
к
осени
1994
года
был
зарегистрирован
первый
миллион
посещений
,
друзья
поняли
,
что
в
их
руках
находится
по
-
тенциальный
бизнес
.
Весной
1995
года
с
помощью
инвесторов
были
собраны
2
миллиона
долларов
и
образована
компания
Yahoo! Inc.
со
штаб
-
квартирой
в
местечке
Сан
Вэлли
в
Кремниевой
долине
.
Уже
к
1997
фирма
имела
доход
67
млн
долларов
и
вошла
в
список
200
крупнейших
сетевых
компаний
,.
в
настоящее
время
ее
услуга
-
ми
ежегодно
пользуются
237
миллионов
человек
,
адрес
www.yahoo.com
является
одним
из
самых
популярных
в
интернете
.
Компания
не
только
ведет
гигантский
каталог
по
HTML-
страни
-
цам
,
но
обеспечивает
множество
других
интернет
-
услуг
:
полнотек
-
стовый
поиск
,
электронную
коммерцию
,
интернет
-
вещание
и
др
.
Поисковые
системы
.
В
отличие
от
интернет
-
каталогов
поисковые
системы
систематизируют
данные
в
автоматическом
режиме
.
День
и
ночь
программы
-
роботы
,
называемые
пауками
(spider)
ползают
по
Всемирной
паутине
,
заглядывая
во
все
ее
уголки
и
составляя
списки
просмотренных
Web-c
траниц
.
Текст
каждой
страницы
анализируется
с
целью
выявления
значащих
слов
(
то
есть
всех
встречающихся
в
документе
слов
,
за
исключением
артиклей
,
предлогов
и
наиболее
употребительных
слов
,
ничего
не
говорящих
о
содержании
текста
)
встречающихся
на
данной
странице
.
На
основе
этого
анализа
автоматически
составляется
полнотекстовый
индекс
(full-text index),
в
котором
для
каждого
слова
перечислены
адреса
393
страниц
,
где
это
слово
встречается
.
Когда
пользователь
передает
поисковой
системе
запрос
,
представляющий
собой
список
ключевых
слов
(keywords)
,
эти
слова
сопоставляются
с
индексом
и
определяются
Web-
страницы
,
релевантные
(relevant)
,
то
есть
соответствующие
запросу
.
Реальные
алгоритмы
установления
степени
релевантности
очеь
сложны
,
они
учитывают
не
только
факт
наличия
ключевого
слова
в
документе
,
но
и
его
место
(
наиболее
важные
слова
обычно
располагаются
в
заголовке
или
в
начале
документа
),
частоту
встречаемости
и
др
.
Эти
алгоритмы
основаны
на
самых
последних
достижениях
в
области
лингвистики
,
метематической
логики
и
теории
искусственного
интеллекта
,
обычно
они
запатентованы
или
составляют
производственный
секрет
(know-how)
данной
поисковой
системы
.
В
свете
сказанного
ясно
,
что
промышленная
полнотекстовая
поисковая
система
,
обслуживающая
всемирный
интернет
,
представляет
собой
мощнейший
программно
-
аппаратный
комплекс
,
создать
который
под
силу
лишь
крупной
компании
.
Первой
такой
системой
была
AltaVista – «
взгляд
сверху
»,
созданная
в
1995
году
фирмой
Digital Equipment
с
целью
демонстрации
возможностей
своих
компьютеров
.
Система
работает
на
самых
мощных
компьютерах
,
произведенных
компанией
–
это
16
серверов
Alphaserver 8400,
объединенных
в
кластер
.
Каждый
из
серверов
имеет
8
Гбайт
оперативной
памяти
,
содержит
12 RISC-
процессоров
Digital Alfa,
в
качестве
жестких
дисков
используются
высокоскоростные
и
надежные
дисковые
системы
общим
объемом
,
измеряемым
терабайтами
(1
Тбайт
=1000
Гбайт
).
Полнотекстовый
индекс
системы
содержит
информацию
о
550
миллинах
Web-
страниц
на
20
национальных
языках
,
включая
русский
,
японский
,
китайский
и
корейский
.
Более
того
,
обеспечивается
автоматический
перевод
результатов
поиска
на
многие
языки
(
к
сожалению
,
русского
среди
них
пока
нет
).
Производительность
системы
такова
,
что
,
обрабатывая
одновременно
множество
запросов
со
всего
света
,
она
обеспечивает
время
ответа
порядка
0,4-0,5
с
.
Новейшие
научные
достижения
в
области
мультимедиа
позволили
поисковым
системам
индесировать
не
только
тексты
,
но
394
и
встроенные
в
Web-c
траницы
изображения
,
звуковые
и
видеофайлы
.
Например
, c
оответствующий
индекс
AltaVista
учитывает
более
90
миллионов
мультимедиа
-
объектов
.
Вслед
за
AltaVista
в
интернете
появились
конкурирующие
поисковые
истемы
: Lycos, WebCrawler (
от
crawle –
ползать
),
InfoSeek, Google
и
ряд
других
;
поисковую
услугу
ввела
и
фирма
Yahoo.
По
-
видимому
самым
большим
полнотекстовым
индексом
располагает
Lycos,
уже
в
1996
году
его
объем
превышал
4
терабайта
.
Российские
поисковые
системы
если
не
по
объему
,
то
по
качеству
поиска
не
уступают
западным
.
И
хотя
наличие
флексий
(
изменяемых
частей
слова
)
в
русском
языке
существенно
усложняет
задачу
построения
полнотекстовых
индексов
,
накопленный
отечественной
наукой
опыт
построения
библиографических
информационно
-
поисковых
систем
позволил
создать
мощные
и
удобные
в
использовании
поисковые
системы
,
самыми
известными
из
которых
являются
Я
ndex, Rambler
и
Aport.
Социальные
и
экономические
последствия
интернет
-
революции
Предельная
легкость
,
интуитивная
понятность
и
универсальность
Web-
интерфейса
,
наличие
в
Сети
разви
-
тых
средств
поиска
сделали
интер
нет
к
началу
XXI
века
универсальной
информационно
-
коммуникационной
средой
и
мощным
средством
ускорения
информационной
революции
,
о
которой
мы
говорили
в
самом
начале
этой
книги
.
И
хотя
сетевые
технологии
продолжают
бурно
развиваться
,
предлагая
пользователям
все
новые
и
новые
вы
-
сокоуровневые
услуги
и
соответствующие
им
протоколы
,
уже
сей
-
час
ясно
,
что
компьютерные
сети
изменили
мир
не
в
меньшей
сте
-
пени
,
чем
сами
компьютеры
.
Билл
Гейтс
,
хоть
и
с
опозданием
,
но
все
же
оценивший
роль
информационных
сетей
в
современном
мире
,
высказался
очень
образно
и
точно
: «
Интернет
завтра
будет
тем
,
чем
сегодня
является
автомобиль
».
Последствия
этого
феномена
,
его
влияние
на
социальнцю
сфе
-
ру
–
науку
,
культуру
,
образование
,
здравоохранение
, –
а
также
на
всю
мировую
экономику
,
еще
предстоит
осмыслить
и
оценить
.
По
этому
поводу
написана
не
одна
книга
и
будет
написано
еще
очень
395
много
,
недаром
в
ряде
вузов
,
в
частности
,
в
Томском
государстве
-
ноом
университете
,
создаются
кафедры
гуманитарных
проблем
ин
-
форматики
.
В
данном
разделе
мы
лишь
упомянем
некоторые
,
уже
очевидные
результаты
продолжающейся
интернет
-
революции
.
Средства
массовой
информации
.
Глобальная
телекоммуни
-
кационная
система
в
корне
меняет
деятельность
средств
массо
-
вой
информации
.
На
смену
бумажным
газетам
и
журналам
при
-
ходят
электронные
;
обычное
радиовещание
и
телевидение
,
пока
уступающее
сетевому
из
-
за
низкой
пропускной
способности
ка
-
налов
связи
,
будет
неизбежно
вытесняться
«
видео
по
требова
-
нию
»,
а
домашние
телевизоры
будут
снабжены
интернет
-
при
-
ставками
.
В
этой
перспективе
вполне
логичными
являются
дей
-
ствия
крупнейших
медиа
-
компаний
,
направленные
на
глубокую
интеграцию
традиционных
и
перспективных
средств
массовой
информации
.
Например
,
в
2001
году
весь
мир
был
свидетелем
рекордной
по
масштабам
(
более
120
миллиардов
долларов
)
сдел
-
ки
между
крупнейшим
интернет
-
провайдером
America On-Line
и
газетно
-
телевизионной
империей
Time Warner,
которой
при
-
надлежит
,
среди
прочих
,
знаменитый
круглосуточный
новостной
канал
CNN.
В
результате
их
слияния
образовался
медиа
-
гигант
с
годовым
доходом
более
40
млрд
.
долларов
,
знаменующий
но
-
вый
уровень
информационных
технологий
в
XXI
веке
.
Образование
и
культура
.
Интенсивное
накопление
в
Сети
по
-
знавательных
и
информационных
ресурсов
(
учебных
,
научных
и
художественных
книг
,
справочников
,
электронных
копий
произве
-
дений
изобразительного
искусства
,
музыкальных
записей
и
т
.
д
.)
может
принципиальным
образом
изменить
систему
профессиональ
-
ного
и
эстетического
образования
.
Для
нашей
безбрежной
страны
это
важно
вдвойне
,
так
как
с
помощью
интернета
сокровища
миро
-
вой
науки
и
культуры
становятся
доступными
не
только
обитате
-
лям
больших
городов
с
их
музеями
и
библиотеками
,
но
и
жителям
самых
отдаленных
селений
,
которые
можно
подключить
к
инфор
-
мационным
магистралям
по
спутниковым
радиолиниям
типа
DirecPC.
Тем
самым
складываются
благоприятные
условия
для
пре
-
396
доставления
населению
новых
видов
образовательных
услуг
.
В
ча
-
стности
,
в
последние
годы
очень
активно
развивается
система
дис
-
танционного
обучения
,
дающая
возможность
получить
професси
-
ональное
образование
в
лучших
вузах
страны
независимо
от
места
жительства
.
Здравоохранение
.
Список
социальных
последствий
интер
-
нет
-
революции
можно
продолжать
еще
долго
,
мы
упомянем
еще
лишь
одну
,
но
важную
тему
–
телемедицину
.
Речь
идет
о
воз
-
можности
получения
по
интернету
консультаций
в
режиме
on-
line
у
ведущих
специалистов
,
находящихся
на
расстоянии
тысяч
километров
от
постели
больного
,
то
есть
о
создании
некоторого
виртуального
госпиталя
.
Работники
здравоохранения
считают
это
направление
исключительно
перспективным
,
именно
поэто
-
му
американский
проект
интернета
нового
поколения
NGI,
о
котором
мы
уже
упоминали
,
в
значительной
степени
ориенти
-
рован
на
задачи
телемедицины
.
Не
менее
значительным
является
влияние
интернет
-
революции
на
экономику
.
На
рисунке
в
схематической
форме
представлены
ос
-
новные
связи
некоторого
хозяйствующего
субъекта
(Business) c
соб
-
ственными
работниками
(Employee),
покупателями
и
клиентами
(Customer, Client),
другими
субъектами
бизнеса
,
а
также
правитель
-
ственными
учреждениями
(Government).
Для
обозначения
этих
свя
-
зей
в
современном
компьютерном
жаргоне
используются
специфи
-
ческие
сокращения
вроде
B2B,
которое
получилось
,
когда
во
фразе
Business to Business
предлог
«to»
изменили
на
аналогичное
по
зву
-
чанию
числительное
«two»,
а
потом
на
цифру
2.
С
появлением
об
-
щедоступной
,
надежной
и
защищенной
мировой
телекоммуника
-
ционной
системы
эти
сложившиеся
десятилетиями
традиционные
связи
приобретают
новые
формы
,
появляются
невиданные
доселе
возможности
.
B2E (
бизнес
–
работник
).
Всегда
считалось
непреложной
ис
-
тиной
,
что
работник
не
только
физического
,
но
и
творческого
труда
должен
находиться
на
своем
предприятии
«
от
звонка
до
звонка
»,
только
там
он
мог
общаться
с
коллегами
,
получать
задания
и
отчи
-