Во всем мире Python известен, как один из основных языков для решения математических задач, но какие же инструменты используют профессиональные разработчики?
Этот рассказ стоит начать с Numpy, потому что Pandas строится поверх нее.
Основная «фича» Numpy – это возможность работать с многомерными массивами, матрицами различных размеров, которые являются «строительными кирпичиками» для современных нейронных сетей. В матрицах куда удобнее представлять веса нейронных сетей, входные и выходные данные.
Что касается Pandas , то он вполне может быть использован как «Excel для Python».
В него можно загружать данные в формате csv, Excel, представлять их в формате dataframe (двумерный массив, примерно как таблица, но именно в Python).
Там вы сможете группировать данные, получать статистики по любой колонке, проверять и опровергать любые статистические гипотезы( правда для этого может потребоваться еще библиотека scipy).
Иными словами, в 2020 году Pandas и Numpy входит в джентльменский набор аналитика данных (Data Science). Для визуализации данных обычно используется третья библиотека - matplotlib, которая может строить графики практически в любом виде, и все напрямую из программы!
#DataScience #inordicликбез