こんにちは、ぼりたそです!今回はPythonのデータ型についてまとめた記事を書いてみました。
この記事は以下のポイントをまとめています。
Pythonにはデータの型があり、データを扱う上で非常に重要な概念になるので、データ分析をしたいという方やデータサイエンティストを目指す方がいらしたら是非ご覧ください。
データ型と種類
さて、いきなりデータ型を学ぼうと言われても何のことやら?と思われる方が大半かと思います。データ型とはざっくりデータの種類や性質を決めるものだと思って下さい。例えばPythonでは ‘ぼりたそ’ は文字列型として認識されますし、2は整数型として認識されます。
このデータ型によってできることやできないことがあり、それをきちんと理解しておかないとエラーの元になってしまうので注意しましょう。例えば整数型の2は掛け算、割り算が可能ですが、文字列型の ‘ぼりたそ’ ではエラー(TypeError)となってしまいます。
Pythonのデータ型の種類を以下に記載しました。全てというわけではありませんが、おおよそ網羅できているはずです。次の章より各データ型について解説していきます。
データ型 | 説明 | 例 |
---|---|---|
str | 文字列 | ‘ぼりたそ’, ‘100’ |
int | 整数 | 1, 10, 100 |
float | 少数 | 3.14, 1.41 |
bool | 真偽値 | True, False |
list | リスト | [1,2,3], [‘りんご’, ‘みかん’, ‘バナナ’] |
dictionary | 辞書 | {名前 : ‘ぼりたそ’, 趣味 : ‘ブログ’} |
tupple | タプル | (‘グー’, ‘チョキ’, ‘パー’) |
set | 集合 | {1,2,3,4,5} |
str型(文字列)
str型と呼ばれるものは文字列のデータ型になります。文字列と言われると数値以外のひらがな、漢字、アルファベットの並びというイメージを持たれるかもしれません。
しかし、Pythonにおいては文字列とはシングルクオーテーション(‘ ‘)またはダブルクオーテーション(” “)で囲ったデータを意味します。なので、’ぼりたそ’や’Python’は文字列なのはもちろんのこと、数値を囲った’100’や’3.14’なども文字列として扱われます。
よくあるのはデータ処理などで数値の計算をしているときにデータ型が文字列なのに数値として計算してエラーが発生するみたいなことがあります。ぜひ注意してみて下さい。
ちなみにデータ型を確かめる場合はtype関数を使うと一発でわかります。下にサンプルコードを載せておきますね。
type('ぼりたそ')
#出力結果
#str
type('2')
#出力結果
#str
print(2+'2')
#出力結果
#TypeError: unsupported operand type(s) for +: 'int' and 'str'
#同じ2でもデータ型がintとstrではタイプエラーが発生する。
int型(整数)
int型は整数のデータ型になります。1, 10, 100などがそうですね。’ ‘などで囲ってしまうとstr型になってしまうので注意です。
type(2)
#出力結果
#int
type('2')
#出力結果
#str
float型(少数)
float型は少数のデータ型になります。1.1, 3.14などが該当します。int型との演算が可能で演算後の解はfloat型になります。
type(3.14)
#出力結果
#float
print(1+3.14)
#出力結果
#4.14
type(1+3.14)
#出力結果
#float
#intとfloatの計算結果はfloat型になる
bool型(真偽値)
bool型とは真偽値のデータ型になります。真偽値とは聞き慣れないかもしれませんが、その名の通りTrueとFlaseのことを指します。bool型の面白いところはTrue, Falseがそれぞれ1, 0と等価であるという点です。なので算術計算も可能になります。以下にサンプルコードを記載します。
type(True)
#出力結果
#bool
print(True+True)
#出力結果
#2
#Trueが1として計算されている
print(1+True)
#出力結果
#2
#int型と計算も可能
終わりに
以上がデータ型の解説になります。実はまだリスト型や辞書型、タプル型など重要なデータ型があるのですが、長くなりそうなので別の記事にて解説したいと思います。