kernel/seinfo — библиотека, позволяющая по произвольному URL определить следующую информацию:

Примечание: Урлы страниц поисковиков, не являющихся поисковыми выдачами, не считаются поисковыми урлами.

Библиотека основана на наборе регекспов, которые компилируются в один большой регексп (работающий через pire для быстрой проверки урла и pcre для извлечения значения полей).

По состоянию на ревизию 937833 она поддерживала 50 поисковых систем, 26 новостных сайтов, популярных в России (для анализа внутренних поисков), 3 социальные сети (vkontakte, twitter, facebook), 11 музыкальных сайтов, 5 сайтов по поиску вакансий (популярных в России), 30 торрент-сайтов (популярных в СНГ).

Библиотека со временем расширяется.

По поводу использования и обновления библиотеки обращаться к Михаилу Шахраю, по поводу этого вьювера — к Юрию Картыннику.

Под катом — составной регексп по состоянию на ревизию 1075539.