Исследователи из Нью-Йоркского университета разработали математический подход, позволяющий предсказывать структуру кристаллов — важнейший шаг в разработке многих лекарств и электронных устройств — всего за несколько часов с помощью ноутбука, при том, что раньше на это у…
Популярные наручные часы Q&Q давно покорили весь мир и продаются во всех уголках нашей планеты. Компания производит классические наручные часы, модные часы мужские наручные и часы женские наручные, на браслетах и ремнях, а также часы детские. Наручные часы соединили в себе надежное качество часов по доступной цене и широкий ассортимент с многофункциональными часами различного дизайна. […]
В предыдущем материале из этой серии мы простыми словами рассказали о том, что такое обучение с подкреплением (Reinforcement learning, RL). Там мы, на интуитивном уровне, разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач. В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов. Читать далее
В 1996 году испанский физик Хуан Паррондо сделал невероятное открытие: иногда две игры, каждая из которых отдельно заканчивается проигрышем, можно объединить в выигрышную стратегию. Этот парадокс — не просто математический курьёз, он имеет научное значение. Он помогает объяснить разнообразные факты из жизни слизевиков и может способствовать разработке новых стратегий лечения рака. Читать далее