2023-01-01から1年間の記事一覧

【R言語】uniteを使った列の結合

unite関数は、データフレームの列を結合するための関数で、複数の列を結合して新しい列を作成することができます。 unite関数は、以下のような構文を持ちます。 unite(data, col, ..., sep = "_", remove = TRUE) data : データフレーム col : 新しい列名 ..…

SQLのcase whenと同じことをpandas.DataFrameに対して行う

pandas.DataFrameに対してSQLのcase whenと同じことをして、新しい列を作る方法がはいくつかあるようなので、まとめておく。 元データ import pandas as pd import numpy as np df=pd.DataFrame({'fruit':['Strawberry','Apple', 'Peach', 'Banana', 'grapes…

【Python】pd.period_range()を使ってyyyy-MM.parquetのファイルを順番に読み込む

下記のようなディレクトリ構成になっているときに、いい感じにファイル名のyyyy-MMを順番に取得して、処理をしたいときはpd.period_range()が便利です。 GA_log ├── 2017-01.parquet ├── 2017-02.parquet ├── 2017-03.parquet ├── 2017-04.parquet ├── 2017-…

【Python】pd.date_range()で指定した範囲の日付を取得

pandas.date_range()とは pandas.date_range()は、pandasライブラリの関数で、datetime型のindexを作成するために使用されます。戻り値はDatetimeIndexオブジェクトであり、生成された日付がインデックスとして格納されます。この関数は、start引数とend引数…