Crawler? Что это?
В чем отличие вакансий Crawler от вакансий Scripters?
Вакансия с Job Board
Вакансия с первоисточника
Каким он должен был быть, и каким он есть сейчас
Сколько людей работает в отделе Crawler?
Общая схема работы отдела
Немножко цифр
Откуда Crawler берет так много сайтов?
Чем вы можете нам помочь?
Какие цели и задачи стоят перед отделом?
Проблемы отдела
Результаты работы
Вопросы?
9.96M

Crawler вакансий

1. Crawler? Что это?

Индексирует вакансии
Сайты компаний(первоисточники)
Сокращение времени отклика на вакансию
У пользователей больше доверия к таким
вакансиям

2. В чем отличие вакансий Crawler от вакансий Scripters?

3. Вакансия с Job Board

4. Вакансия с первоисточника

5. Каким он должен был быть, и каким он есть сейчас

Обучение -> Валидация -> Индексирование

6. Сколько людей работает в отделе Crawler?

31

7. Общая схема работы отдела

8. Немножко цифр

Сколько сайтов индексирует Crawler на данный момент?
23 452 сайта/523 053 вакансий
12 155 сайтов/7 187 494 вакансий
Сколько в среднем обрабатывается новых сайтов?
1 500 сайтов/день
12 сайтов/день
Сколько в среднем новых сайтов добавляется в индекс?
250 сайтов/день
9 сайтов/день
Сколько новых сайтов в очереди на обработку?
72 000 сайтов
Сколько менеджеры пришлют
Какое среднее кол-во вакансий на один проект?
22 вакансии на проект
590 вакансий на проект

9. Откуда Crawler берет так много сайтов?

Парсинг, парсинг и ещё раз парсинг…
• Ежедневный автоматический парсинг Indeed
• Поиск сайтов по названию компаний
• Парсинг Job Boards на наличие сайтов первоисточников
• Обработка ATS

10. Чем вы можете нам помочь?

Отправляйте на [email protected]:
• Сайты компаний с вакансиями
• Локальные каталоги компаний
• Локальные ATS
• Любые другие источники сайтов компаний

11.

12.

13.

14.

15. Какие цели и задачи стоят перед отделом?

«Помочь людям найти работу»
Прокофьев Р.В.
Максимально увеличить кол-во вакансий из первоисточников в базах Jooble
Для начала:
- Проиндексировать все, что индексирует Indeed
Затем:
- Уничтожить Indeed и проиндексировать все остальное

16. Проблемы отдела

• Crawler требует ещё много технических улучшений и доработок
• Нет 100% автоматического способа определить есть ли на сайте
вакансии
• Криворукие программисты сайтов
• Нет способа автоматически опознавать мертвые сайты

17.

18. Результаты работы

Страна
% вакансий в базе от Crawler
CH
IE
AT
NL
FI
DE
BE
FR
SE
DK
HU
31,2
27,9
24,3
23,7
22,2
15,0
13,6
13,1
12,3
11,6
11,4

19. Вопросы?

Всем спасибо за внимание!
Вопросы?
English     Русский Правила