В процессе экспериментов с NLU и данными мне понадобился какой-то интересный датасет. Готовые английские датасеты показались мне скучными, веб-данные банальными и разнородными. В общем я тут структурировал и выложил в машинно-читаемом виде разные (пока русские, но доложу и остальные) версии Библии. Если вам это зачем-то надо - загляните. Забавно: уже когда я все выложил - внезапно вспомнил, что одним из первых продуктов Яндекса был именно поиск по Библии. github.com/bobuk/hollybooks
bobuk/hollybooks