Автоматическое перефразирование текстов может быть полезно в куче задач, от рерайтинга текстов до аугментации данных. В этой статье я собрал русскоязычные корпуса и модели парафраз, а также попробовал создать собственный корпус, обучить свою модель для перефразирования, и…
Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная
Иногда возникает необходимость провести анализ большого количества текстовых данных, не имея представления о содержании текстов. В таком случае можно попытаться разбить тексты на кластеры, и cгенерировать описание для каждого кластера. Таким образом можно в первом приближении сделать выводы о содержании корпуса текстов. Читать далее
Четвертый Международный фестиваль русских театров республик Северного Кавказа и стран Черноморско-Каспийского региона торжественно открылся сегодня в Дагестане. Программа фестиваля включает показ 16 спектаклей в период с 27 сентября по 5 октября. В этом году спектакли дагестанскому зрителю представят 17 русских театров драмы и комедии из Германии, Грузии, Казахстана, Болгарии, Москвы, Ингушетии, Чечни, Северной Осетии, Кабардино-Балкарии, […]