2020-06-01から1ヶ月間の記事一覧

df.agg()にgroupbyが使えると聞いて

グループごとに個数・平均値・中央値など複数の集計を出したいときにdf.groupby().agg()を使うと便利ですよ。 これは個人のブログなので間違いがあるかもしれませんので、正しい情報が欲しい人は公式ドキュメントを読んでください。 サンプルコード import p…

pythonの決定木のコードサンプル

毎回決定木を試みるときにどうやって書くのかさっぱり忘れていて、いちから探しているので、とりあえず自分のためにメモを書いておこうと思います。 完全にメモですので、間違いなどがあると思います。参考程度にして、ご自身で実装される際はきちんと公式ド…

tweepyを使って日本語のみのtweetを取得

個人的なブログですので、内容に誤りがある場合があります。間違いのない情報が欲しい場合は公式ドキュメントを読んでください。優しい方は間違いを指摘していただけると嬉しいです。 つい先日まで、tweepyでツイートのテキスト情報を取得するときはなぜか日…

一致推定量と不偏推定量

※ 個人的なメモですので、間違いがいあるかもしれません。 推定量とは サンプルから得た統計量をもとに、母集団のパラメータを推定するとき、サンプルの統計量のこと 一致推定量 サンプルサイズが大きくなると、推定量がだんだんと真のパラメータに近づく 不…