Сообщения

Сообщения за май, 2018

Прикладная кластеризация. Выделение объективных ниш мобильных приложений Apple App Store.

Изображение
  Введение Когда очень много приложений – это проблема. Растущий из года в год рынок мобильных приложений к 2020 году достигнет объема $189 млрд. Только в Apple App Store количество мобильных приложений превысило 3 миллиона, из которых 783 000 приходится на игры, а остальное - на неигровые приложения. И если все игры распределены по 19 игровым категориям (в среднем 41 000 игр на каждую категорию), то 2,3 млн неигровых приложений заключены в рамки всего 24 категорий (почти 96 000 приложений в среднем на категорию). Проблема пользователя. Приложений очень много, а категорий мало. С одной стороны, разработчики часто вынуждены размещать свои приложения в категориях, лишь очень приблизительно описывающих их функционал, а с другой - пользователи вынуждены примерять свои потребности к ограниченному количеству статичных категорий, которые существуют в магазинах приложений в практически неизменном виде с момента их открытия. Не найти, не заметить или пропустить нужное приложение в та

Выбор метрики в машинном обучении

Изображение
Как выбрать метрики для валидации результата Machine Learning  Главные шаги по выбору метрики  Следует заметить, что метрика, которую мы оптимизируем и метрика, по которой определяем качество модели, - как правило, разные. Ниже рассмотрим метрики, которые мы в том или ином виде можем оптимизировать непосредственно в модели. За метрики, которыми мы оцениваем результат работы модели, можно принять исходные бизнес-метрики. Понимание бизнес задачи Из исходных предпосылок нужно выделить, какого типа задачу мы решаем. Основные типы задач: Классификация. Ваш алгоритм будет предсказывать тип данных из заданного множества. Например говорить да/нет/не уверен.  Регрессия. Алгоритм будет предсказывать какие-либо числа. Например, завтрашнюю температуру.  Ранжирование. Модель будет предсказывать порядок элементов. Например, нам дали учебный класс и мы должны проранжировать учеников по росту, то есть, упорядочить их от самого высокого, до самого низкого. Мы решаем задачу нахождени