2020-01-01から1年間の記事一覧

df.agg()にgroupbyが使えると聞いて

グループごとに個数・平均値・中央値など複数の集計を出したいときにdf.groupby().agg()を使うと便利ですよ。 これは個人のブログなので間違いがあるかもしれませんので、正しい情報が欲しい人は公式ドキュメントを読んでください。 サンプルコード import p…

pythonの決定木のコードサンプル

毎回決定木を試みるときにどうやって書くのかさっぱり忘れていて、いちから探しているので、とりあえず自分のためにメモを書いておこうと思います。 完全にメモですので、間違いなどがあると思います。参考程度にして、ご自身で実装される際はきちんと公式ド…

tweepyを使って日本語のみのtweetを取得

個人的なブログですので、内容に誤りがある場合があります。間違いのない情報が欲しい場合は公式ドキュメントを読んでください。優しい方は間違いを指摘していただけると嬉しいです。 つい先日まで、tweepyでツイートのテキスト情報を取得するときはなぜか日…

一致推定量と不偏推定量

※ 個人的なメモですので、間違いがいあるかもしれません。 推定量とは サンプルから得た統計量をもとに、母集団のパラメータを推定するとき、サンプルの統計量のこと 一致推定量 サンプルサイズが大きくなると、推定量がだんだんと真のパラメータに近づく 不…

pythonのPILを使って3枚の画像を横に並べる

PILを今まで使ったことがなく、備忘録のために記録していきます。 あくまでも自分の備忘録です。 コピペの部分が多くまだ使いかたが良くわからないので、間違いなどあれば教えていただけると嬉しいです。 PILはOpenCVのように複雑な処理(この辺りはよくわか…

tweepyを使ってブロックしている人の一覧を取得

tweepyを使うことで、自分をブロックしているユーザーの一覧が取得できるようです。 コード import tweepy consumer_key = '***' consumer_secret = ' *** ' access_key = ' *** ' access_secret = ' *** ' auth = tweepy.OAuthHandler(consumer_key, consum…

プロ野球の全選手のデモグラ情報をpythonでスクレイピングして取得する

プロ野球選手のデモグラ情報取得するためのpython 書きましたー