Какво и как трябва да уча, за да стана анализатор на данни / учен? Има ли разлика между двете?


Отговор 1:

Това е особено вярно за технологии като Data Science, машинно обучение и AI, които са били използвани, прекалено използвани и понякога подтиквани за изпълнение на маркетинговите цели. Важно е да се разбере, че макар тези полета да се припокриват, те не могат да се използват взаимозаменяемо.

Казано с прости думи, науката за данните генерира прозрения, докато машинното обучение генерира прогнози. AI, от друга страна, генерира действия.

Запознаване с Data Science

Науката за данни е една от най-добрите дисциплини за придобиване на различен тип прозрения - описателни, проучвателни, инфекциозни, случайни, прогнозни и механистични прозрения. Науката за данните включва статистически изводи, проектиране на експерименти, софтуерно инженерство, визуализация на данни, специфични познания в областта и ефективна комуникация.

Това, което отличава науката за данни освен свързани области като машинно обучение и ИИ, е необходимостта от участие на човека в цикъла. Винаги има нужда някой да разбере прозренията, да осмисли графиките и фигурите и да вземе категорични решения въз основа на получените прозрения.

Вероятни прогнози чрез машинно обучение

Машинното обучение гарантира, че прогнозите, направени от голямо количество събрани данни, са възможно най-точни. Науката за данни и машинното обучение се припокриват много. Например, логистичната регресия се прилага както в науката за данни, така и в машинното обучение. Въпреки това, в науката за данни се използва за получаване на представа за връзките на различни фактори, докато при машинното обучение дава прогнози.

Специалистите в индустрията често преминават между двете дисциплини, а учените по данни използват машинно обучение. Например в приложение за електронно обучение, данните за трафика могат да бъдат моделирани, за да се определи кои клиенти вероятно ще търсят конкретен продукт. Това е приложение за машинно обучение. Когато обобщенията и визуализациите са създадени въз основа на трафика на данни, това е приложение на науката за данните.

Автоматизиране на действия с изкуствен интелект

AI включва предаване на човешкия познавателен интелект на компютрите. Всяка машина, която изпълнява задача или действие по интелигентен начин, с използването на алгоритми се казва, че прилага AI. Важно разграничение между ИИ и другите две дисциплини е частта от „събитието, което може да се изпълни”. AI се използва широко в робототехниката, теорията на управлението, алгоритмите за игри, ботовете и обучението за подсилване.

Помислете за анализа на клиентските данни за определен продукт. Да предположим, че е установено, че някои клиенти вероятно ще купят повече от други (прозрение). Получават се числени и графични резултати, които позволяват на ръководителите да правят прогнози и / или да стигат до заключения; това обаче може да не доведе до някакви конкретни действия. Това би било приложение на науката за данни с комбинация от машинно обучение, но не и AI.

Комбиниране на наука за данни, машинно обучение и AI

Да предположим, че се изгражда термостат с възможност за самонастройване. Трите технологии тогава биха могли да се използват, както следва:

  1. Машинно обучение: Голям набор от данни за стойности, свързани с околната среда, за да се разработи алгоритъм, който да предвиди желаните температурни диапазони и да достигне фиксирана стойност. Изкуствен интелект: След като се изпълни определено условие за околната среда, термостатът извършва автоматизирано действие - приспособяване към фиксирана температура от съответния диапазон

Science Science: По време на тестовете с термостата понякога температурите се оказват неподходящи за хората в домовете им, особено през работните часове на деня. След изучаването на данните от теста се получава представа, че вариращата телесна температура не е взета под внимание. По този начин е необходимо да се изгради по-добър набор от данни, който да включва данни за телесната температура. След това целият процес се повтаря.

За тези, които се интересуват, можете да ме изпратите на имейл на [email protected]