[解決済み] Pandasが認識するすべてのdtypesは何ですか?
質問
pandasの場合、以下のデータ型以外のデータ型があれば、どなたかご存知でしょうか?
(i)
float64
,
int64
(など)の変種があります。
np.number
のように
float32
,
int8
など)
二
bool
三
datetime64
,
timedelta64
文字列のようなカラムは、常に
dtype
の
object
?
あるいは、上のリストの (i), (ii), (iii) 以外に、以下のようなデータ型があるかどうか知りたい。
pandas
は、その
dtype
である。
object
?
解決方法は?
EDIT 2020年2月 pandas 1.0.0リリースに伴う変更点
Pandasは主にNumPyの配列と各Seriesにdtypesを使用します(データフレームはSeriesの集まりで、各Seriesは独自のdtypesを持つことができます)。 NumPyのドキュメントでは、さらに次のように説明されています。 dtype , データ型 および データ型オブジェクト . さらに、@lcameron05 が提供する回答は、numpy の dtypes について素晴らしい説明をしています。さらに、pandasのdocs on dtypes には、さらに多くの情報があります。
<ブロッククオートpandasのオブジェクトに格納される主な型はfloat、int、boolです。 datetime64[ns]、timedelta[ns]、object。さらに、これらのdtypesは は、int64 や int32 のような項目サイズを持ちます。
<ブロッククオートデフォルトでは、整数型はint64、浮動小数点型はfloat64です。 プラットフォーム(32ビットまたは64ビット)に関係なく。以下はすべて の場合、int64のdtypesになります。
しかし、Numpyでは、プラットフォーム依存の型が選択されます。
配列になります。以下のようにすると、32ビットプラットフォームではint32になります。
pandasのバージョン1.0.0での大きな変更点の1つが
pd.NA
を使用して、スカラー欠損値を表現します (以前の値である
np.nan
,
pd.NaT
または
None
使用方法によって異なります)。
Pandasは、NumPyの型システムを拡張し、また、ユーザーが自分自身の型システムを書くことができるようにします。 拡張型 . 以下にpandasの拡張型の一覧を示します。
データの種類:tz-aware datetime (NumPyはtimezone-aware datetimeをサポートしないことに注意).
データ型 DatetimeTZDtype
スカラー タイムスタンプ
配列です。 arrays.DatetimeArray
文字列のエイリアス:'datetime64[ns, ]'
データの種類 カテゴリー
データ型 CategoricalDtype
スカラー (なし)
配列です。 カテゴリー
文字列のエイリアス:'category'
データの種類:ピリオド(タイムスパン)
データ型 ピリオドタイプ
スカラー 期間
配列です。 arrays.PeriodArray
文字列のエイリアス:'period[]'、'Period[]'
データの種類:スパース
データ型 SparseDtype
スカラー (なし)
配列です。 arrays.SparseArray
文字列のエイリアス: 'Sparse', 'Sparse[int]', 'Sparse[float]'.
データの種類:インターバル
データ型 インターバルタイプ
スカラー インターバル
配列です。 arrays.IntervalArray
文字列のエイリアス:'interval'、'Interval'、'Interval[<numpy_dtype>]'、 'Interval[datetime64[ns, ]]'、'Interval[timedelta64[]]]'
データの種類: nullable integer
データ型です。 Int64Dtype , ...
スカラー (なし)
配列です。 arrays.IntegerArray
文字列のエイリアス: 'Int8', 'Int16', 'Int32', 'Int64', 'UInt8', 'UInt16', 'UInt32', 'UInt64'.
データの種類 文字列
データ型です。 文字列型
スカラー スト
配列です。 arrays.StringArray
文字列のエイリアス:'string'
データの種類 ブール値(NA付き)
データ型 BooleanDtype
スカラー ブール
配列です。 arrays.BooleanArray
文字列のエイリアス:'boolean'
関連
-
opencvとpillowを用いた顔認証システム(デモあり)
-
[解決済み】 NameError: グローバル名 'xrange' は Python 3 で定義されていません。
-
[解決済み] Pythonのリストメソッドであるappendとextendの違いは何ですか?
-
[解決済み] Python 3 の "python -m SimpleHTTPServer" に相当するものは何ですか?
-
[解決済み] Pandas DataFrameの行数を取得する方法は?
-
[解決済み] Pythonが解釈される場合、.pycファイルとは何ですか?
-
[解決済み] pandasを使った "大量データ "ワークフロー【終了しました
-
[解決済み] Pythonの「名前付きタプル」とは何ですか?
-
[解決済み】__str__と__repr__の違いは何ですか?
-
[解決済み】type()とisinstance()の違いは何ですか?)
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Pythonの非常に便利な2つのデコレーターを解説
-
PythonによるLeNetネットワークモデルの学習と予測
-
Python百行で韓服サークルの画像クロールを実現する
-
Pythonコードの可読性を向上させるツール「pycodestyle」の使い方を詳しく解説します
-
Python入門 openを使ったファイルの読み書きの方法
-
[解決済み】pygame.error: ビデオシステムが初期化されていない
-
[解決済み] TypeError: 'DataFrame' オブジェクトは呼び出し可能ではない
-
[解決済み】Python: SyntaxError: キーワードは式になり得ない
-
[解決済み】 TypeError: += でサポートされていないオペランド型: 'int' および 'list' です。
-
[解決済み] pandasのデータフレーム列のdtypesを割り当てる