pandas の基本

今回はpandasの基本的なところをお勉強していきます。サンプルデータについては例によって競馬に関連することを使用します。

 

※google colab 使用

 

インポート

まずはnumpyとpandasをインポート

 

Seriesオブジェクト

最初は、pandasのSeriesオブジェクトです。1次元のインデックス付きのデータになります。リストまたは配列から作成できます。

まずは、数値

values属性とindex属性でアクセスできます。

角括弧表記でインデックスからデータにアクセスできます。

スライス

 

インデックスは任意の型が可能。例として文字列をインデックスにしてみます。

文字にしたインデックスでアクセスできます。

 

dataに辞書を使ってみましょう。

インデックスも文字列にしましょう。

 

DataFrameオブジェクト

インデックスをそのままにして違うデータを作ります。

辞書を使って1つの2次元オブジェクトにしてみます。

#結果


2次元のオブジェクトになりました。

 

データを追加してみましょう。

 

#結果

追加されました。

 

新しい列を追加します。

さきほどの2次元オブジェクトに追加します。

#結果

3列6行になりました。

 

データの選択方法

データの選択の例です。

・明示的なインデックスによるスライス

#結果

皐月賞から秋華賞まで選択されました。

 

・列の選択

 

まとめ

今回はここまで。pandasの基本中の基本のところを競馬データを使って実行してみました。