КПІ-Телеком, науково-технічне об`єднання
 
На головну сторінкуНаписати листаМапа сайту



Технічне завдання пошукової системи

Мета універсальної системи пошуку – пошук по імені файлів та контенту (на http, ftp, news ресурсах) в мережі КПІ.

1. Базовий режим пошуку (параметри релевантності та критерії пошуку автор обирає сам)

2. Розширений режим пошуку, що має наступні можливості для кожної із областей:

a. ftp:

1. за датою файлу на ресурсі (не обов‘язково)
2. розмір файлу
3. тип файлу
4. за розширенням файлів (можливо, включити в пошук по імені файлу)
5. окремий пошук в шляху/імені/шляху +файл/контент
6. стан ресурсу (online/offline)

b. http:

1. контент
2. тип файлу
3. стан ресурсу (online/offline)
4. ім‘я сервера

c. news

1. контент
2. автор
3. тема повідомлення
4. дата
5. конференція

3. Пошук в знайденому результаті

4. Можливість задавати виключення в пошуковому запиті

5. Сортувати результати пошуку за наступними критеріям:

a. даті файлу на ресурсі (не обов‘язково)
b. розміру
c. типу
d. релевантності
e. даті індексації
f. стану ресурсу (online/offline)
g. ресурсу – http/ftp/news

6. Зберігання перших Х сек медіа файлу на накопичувачах пошукової системи для попереднього перегляду (не обов‘язково).

7. Зберігання на накопичувачах пошукової системи файлів з текстовою інформацією (не обов‘язково).

8. Можливість додавання в пошукову систему та видалення з неї ресурсу власником.

9. Можливість вказати час існування ресурсу.

10. Можливість примусового сканування мережі з деякою періодичністю (не обов‘язково).

11. Відображення приблизної (або точної) кількості результатів пошуку.

12. Можливість вибору відображення кількості результатів на сторінку.

13. Можливість експорту переліку ftp-серверів в формат програм популярних файлових менеджерів (Far, Total Commander).

14. Можливість перегляду проценту змін змісту ресурсів (не обов‘язково)

15. Можливість перегляду лістінгу файлів по типу, які проіндексовані пошуковиком.

16. Відсутність залежності від кодування.

17. При індексації ftp серверів використовувати наступні методи в порядку зменшення пріоритету:

a. Стиснутий файл переліку файлів ресурсу (ls-lR.bz2, ls-lR.gz, тощо).
b. Не стиснутий файл переліку файлів ресурсу (ls-lR).
c. Отримання переліку файлів ресурсу через виконання команди “LIST -lR”.
d. Отримання переліку файлів ресурсу через рекурсивний обхід директорій. (Використання цього варіанту повинно проходити з мінімальним пріоритетом).

18. Передбачити можливість побудови розподіленої системи.

19. Підтримка стандарту Robots.

20. Використання нечіткої логіки (не обов‘язково).

21. Наявність веб-інтерфейсу для пошуку та конфігурування.

Критерії оцінки:
  1. Повнотекстовий пошук в будь-якому кодуванні
  2. Релевантність
  3. Швидкість пошуку
  4. Зручність
  5. Функціональність
  6. Використовувані ресурси системи (процесор, пам‘ять, мережа, інше)
  7. Масштабування



Версія для друкуВерсія для друку