про макулатуру
Jun. 12th, 2017 11:03 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Самый длинный договор, который я лично подписывал, содержал 50 с чем-то страниц legalese мелким шрифтом.
Но он таки меркнет и становится бледной тенью, если посмотреть, какое количество макулатуры регламентирует деятельность банков, бирж, трейдеров и прочих участников рынка в США.
То есть, хм, сами тексты вполне себе структурированы и читабельны. Но вот их количество...
У меня пока что эстимэйт в миллионы страниц, но может быть там и больше...
Короче, очень занятная задача для information retrieval и natural language processing, да :)
Но он таки меркнет и становится бледной тенью, если посмотреть, какое количество макулатуры регламентирует деятельность банков, бирж, трейдеров и прочих участников рынка в США.
То есть, хм, сами тексты вполне себе структурированы и читабельны. Но вот их количество...
У меня пока что эстимэйт в миллионы страниц, но может быть там и больше...
Короче, очень занятная задача для information retrieval и natural language processing, да :)
no subject
Date: 2017-06-12 09:34 pm (UTC)no subject
Date: 2017-06-12 10:27 pm (UTC)При таком подходе у нас автоматически получаются такие приятные мелочи, как переводы на любой нужный нам язык (достаточно сменить набор выходных шаблонов). Машиночитаемый исходник может автоматически обрабатываться — ну, в частности, можно grep'ать противоречия или несовместимости в документах.
А ещё есть smart contract'ы, высокочастотный трейдинг…