Программирование [Udemy]Машинное обучение с Python + Big Data - (Курс 10 из 17)

  • Автор темы Красный Кут
  • Дата начала
К

Красный Кут

ЧЕМУ ВЫ НАУЧИТЕСЬ





– понимать и перечислять различные применения марковских моделей и скрытых марковских моделей;

– понимать, как работают марковские модели;

– создавать марковские модели в коде;

– применять марковские модели к любым последовательностям данных;

– понимать математику, лежащую в основе марковских цепей;

– использовать марковские модели применительно к языкам;

– использовать марковские модели применительно к анализу сайтов;

– понимать, как работает Google's PageRank;

– понимать скрытые марковские модели;

– создавать скрытые марковские модели в коде;

– создавать скрытые марковские модели с помощью Theano;

– понимать, как градиентный спуск, обычно использующийся в глубоком обучении, может использоваться для скрытых марковских моделей.


ТРЕБОВАНИЯ



– быть знакомым с теорией вероятностей и математической статистикой;

– понимать гауссову смесь распределений;

– владение языком Python и библиотекой Numpy.


ОПИСАНИЕ


Скрытые марковские модели (HMM) полностью посвящены изучению последовательностей.

Множество данных, которые могут нам понадобится для моделирования, представлены в виде последовательностей. Цены на акции – это последовательность цен. Текст – это последовательность слов. Кредитная история состоит из последовательностей заимствования и возвращения денег, и можно использовать эти последовательности для прогнозирования, не окажетесь ли вы банкротом. Короче говоря, последовательности повсюду, и возможность их анализа является важным навыком в инструментарии обработки данных.

Простейший способ для оценки информации, получаемой от последовательности, - это взглянуть на читаемый сейчас вами текст. Если бы я написал предыдущее предложение задом наперёд, оно бы оказалось для вас бессмысленным, хотя и состояло бы из тех же самых слов. Так что важен порядок следования.

Хотя нынешняя увлечённость глубоким обучением подталкивает нас использовать рекуррентные нейронные сети для моделирования предложений, я всё же хотел бы сначала представить вам другой алгоритм машинного обучения, существующий уже несколько десятилетий, – скрытую марковскую модель.

Этот курс является непосредственным продолжением моего первого курса по машинному обучению без учителя по кластерному анализу, в котором вы научились измерять вероятностное распределение случайной величины. В этом курсе вы научитесь измерять вероятностное распределение последовательности случайных величин.

Все вы знаете, как я люблю глубокое обучение, поэтому в курсе будет маленькое отступление. Мы уже познакомились с градиентным спуском, и вы знаете, насколько он важен для решения задач глубокого обучения. Я утверждал, что градиентный спуск может использоваться для оптимизации любой целевой функции. В этом курсе я покажу, как можно использовать градиентный спуск для нахождения оптимальных параметров скрытой марковской модели в качестве альтернативы популярному алгоритму максимизации ожиданий.

Всё это мы сделаем в Theano и TensorFlow, являющихся популярными библиотеками глубокого обучения. Благодаря данному курсу вы научитесь работать с последовательностями в Theano и TensorFlow, что окажется очень полезным при рассмотрении рекуррентных нейронных сетей и сетей долгой краткосрочной памяти (LSTM).

Этот курс также включает множество практических применений марковских моделей и скрытых марковских моделей. Мы рассмотрим модель болезни и здоровья и вычислим прогнозное время, в течение которого, в случае болезни, вы проболеете. Мы обсудим, как марковские модели могут быть использовать для анализа взаимодействия пользователей с вашим сайтом и устранения проблемных мест вроде высокого показателя отказов, которые могут повлиять на ваш SEO. Мы построим языковую модель, которую можно использовать для определения автора текста и даже для генерации текста – только представьте себе, что машина пишет текст за вас! Скрытые марковские модели оказались весьма успешными в обработке естественного языка (NLP).

Мы также рассмотрим, вероятно, самое последнее и успешное применение марковских моделей – алгоритм Google’s PageRank. И наконец, мы обсудим даже более практичные способы применения марковских моделей, в том числе генерацию изображений и автозаполнение форм в смартфоне, и с помощью скрытых марковских моделей ответим на один из фундаментальнейших вопросов биологии – каким образом ДНК, этот код жизни, преобразуется в физические и поведенческие свойства организма?

Все материалы, необходимые для этого курса, являются БЕСПЛАТНЫМИ. В основном мы будем работать с применением библиотек Numpy и Matplotlib и немного с применением Theano. Я всегда готов ответить на ваши вопросы и оказать помощь в путешествии по науке об обработке данных.

Этот курс сконцентрирован на том, «как создавать и понимать», а не просто «как использовать». Любой может овладеть пользовательским интерфейсом за 15 минут после прочтения соответствующей документации. Речь идёт не о «запоминании фактов», а о «саморазвитии» посредством набора опыта. Курс научит вас, как наглядно видеть, что происходит внутри модели. Если хотите большего, чем просто поверхностного взгляда на модели машинного обучения, - этот курс для вас.

До встречи на занятиях!



Источник


Скрытый контент.



 
Последнее редактирование модератором:
Сверху Снизу