Pandas и Numpy – набор аналитика данных

Во всем мире Python известен, как один из основных языков для решения математических задач, но какие же инструменты используют профессиональные разработчики?

Этот рассказ стоит начать с Numpy, потому что Pandas строится поверх нее.

Основная «фича» Numpy – это возможность работать с многомерными массивами, матрицами различных размеров, которые являются «строительными кирпичиками» для современных нейронных сетей. В матрицах куда удобнее представлять веса нейронных сетей, входные и выходные данные.

Что касается Pandas , то он вполне может быть использован как «Excel для Python».

В него можно загружать данные в формате csv, Excel, представлять их в формате dataframe (двумерный массив, примерно как таблица, но именно в Python).

Там вы сможете группировать данные, получать статистики по любой колонке, проверять и опровергать любые статистические гипотезы( правда для этого может потребоваться еще библиотека scipy).

Иными словами, в 2020 году Pandas и Numpy входит в джентльменский набор аналитика данных (Data Science). Для визуализации данных обычно используется третья библиотека - matplotlib, которая может строить графики практически в любом виде, и все напрямую из программы!

#DataScience #inordicликбез


Nordic IT School

Москва, ул. Большая Спасская 12

+7 925 632-21-47

+7 495 626-46-00

moscow@inordic.ru