Продукты HFLabs ищут дублированных клиентов в базах федеральных компаний. Очевиднейший способ найти одинаковые клиентские карточки — сравнить паспорта или другие документы, удостоверяющие личность. Раньше мы сравнивали номера документов строго: одинаковые — отлично, нет —…
Бывает так, что критерии поиска текстов слишком сложны, чтобы обойтись регулярными выражениями. В таких случаях на помощь приходит ML. Если из списка текстов выбрать самый подходящий для нас, можно выяснить похожесть всех остальных текстов на этот. Похожесть(similarity) это численная
Все началось с того, что мне нужно было разработать поиск пациентов для одной внутренней медицинской системы. Логика работы была в том, что если мы не нашли человека в системе, то его нужно создать (а дубли пациентов плодить нельзя). В связи с этим одной из подзадач стала реализация поиска людей с учетом опечаток в их именах. Ну а поскольку я люблю PostgreSQL (а когда в руках у тебя молоток, то все похоже на гвозди), не сложно угадать, на чем я решил реализовать поиск с опечатками… Читать дальше →
Мошенничество стало неотъемлемой частью нашей повседневной жизни. Каждый день кто-то становится жертвой хитроумных схем и ловких манипуляций. Обычно мы слышим о таких случаях только от знакомых или через социальные сети, но как же можно заранее защитить себя и своих близких? В этой статье мы поговорим о том, как создать эффективную базу номеров и отзывов о […] Сообщение Защити себя: Как создать базу номеров и отзывов о мошенниках появились сначала на Androha.ru.