Pandas 教程-Pandas 索引
Pandas 教程-Pandas 索引
gh_1d7504e4dee1
回复:python,领取Python面试题。分享Python教程,Python架构师教程,Python爬虫,Python编程视频,Python脚本,Pycharm教程,Python微服务架构,Python分布式架构,Pycharm注册码。
整理: python架构师
Pandas 索引被定义为从 DataFrame 中选择特定行和列数据的重要工具。它的任务是组织数据并提供快速访问数据的能力。它也可以称为子集选择。
索引中的值以粗体字体显示,索引的各个值称为标签。
如果我们想比较有和没有索引时的数据访问时间,可以使用%%timeit来比较各种访问操作所需的时间。
我们还可以将索引定义为通过它可以在整个 Series 或 DataFrame 中访问任何数据的地址。DataFrame 是三个不同组件的组合,即索引、列 和 数据。
轴和轴
轴被定义为一种通用术语,指的是行和列,而轴则是这些行和列的集合。
创建索引
# importing pandas
package
import
pandas
as
pd
data
= pd.read_csv(
"aa.csv"
)
data
Name
Hire Date Salary Leaves Remaining
0
John Idle 03/15/14 50000.0 10
1
Smith Gilliam 06/01/15 65000.0 8
2
Parker Chapman 05/12/14 45000.0 10
3
Jones Palin 11/01/13 70000.0 3
4
Terry Gilliam 08/12/14 48000.0 7
5
Michael Palin 05/23/13 66000.0 8
资源分享
示例1
# importing pandas package
import pandas as pd
# making data frame from csv file
info = pd.read_csv(
"aa.csv"
, index_col =
"Name"
)
# retrieving multiple columns by indexing operator
a = info[[
"Hire Date"
,
"Salary"
]]
print(a)
Name
Hire Date Salary
0
John Idle 03/15/14 50000.0
1
Smith Gilliam 06/01/15 65000.0
2
Parker Chapman 05/12/14 45000.0
3
Jones Palin 11/01/13 70000.0
4
Terry Gilliam 08/12/14 48000.0
5
Michael Palin 05/23/13 66000.0
示例2
# importing pandas package
importpandas as pd
# making data frame from csv file
info =pd.read_csv(
"aa.csv"
, index_col =
"Name"
)
# retrieving columns by indexing operator
a =info[
"Salary"
]
print(a)
Name
Salary
0
John Idle 50000.0
1
Smith Gilliam 65000.0
2
Parker Chapman 45000.0
3
Jones Palin 70000.0
4
Terry Gilliam 48000.0
5
Michael Palin 66000.0
设置索引
info = pd.DataFrame({
’Name’
: [
’Parker’
,
’Terry’
,
’Smith’
,
’William’
],
’Year’
: [
2011
,
2009
,
2014
,
2010
],
’Leaves’
: [
10
,
15
,
9
,
4
]})
info
info.set_index(
’Name’
)
info.set_index([
’year’
,
’Name’
])
info.set_index([pd.Index([
1
,
2
,
3
,
4
]),
’year’
])
a = pd.Series([
1
,
2
,
3
,
4
])
info.set_index([a, a**
2
])
Name
Year Leaves
1
1 Parker 2011 10
2
4 Terry 2009 15
3
9 Smith 2014 9
4
16 William 2010 4
多重索引
数据中还可以有多个索引。
import
pandas
as
pd
import
numpy
as
np
pd.MultiIndex(levels=[[np.nan,
None
, pd.NaT,
128
,
2
]],
codes=[[
0
,
-1
,
1
,
2
,
3
,
4
]])
MultiIndex(levels=[[nan, None, NaT, 128, 2]],
codes=[[0, -1, 1, 2, 3, 4]])
重置索引
我们还可以使用 ’reset_index’ 命令重置索引。让我们再次查看 ’cm’ DataFrame。
info
= pd.DataFrame([(
’William’
,
’C’
),
(
’Smith’
,
’Java’
),
(
’Parker’
,
’Python’
),
(
’Phill’
, np.nan)],
index=[
1
,
2
,
3
,
4
],
columns=(
’name’
,
’Language’
))
info
info
.reset_index()
index
name Language
0
1 William C
1
2 Smith Java
2
3 Parker Python
3
4 Phill NaN
-
为什么没看到嘲笑外包的帖子了?网友:叫包哥~ -
Pandas 教程-Pandas 简便手册 -
“小而美”Tauri已支持iOS和Android,你还在用“技术毒瘤”Electron?
-
2023年血糖新标准公布,不是3.9-6.1,快来看看你的血糖正常吗? 2023-02-07
-
2023年各省最新电价一览!8省中午执行谷段电价! 2023-01-03
-
GB 55009-2021《燃气工程项目规范》(含条文说明),2022年1月1日起实施 2021-11-07
-
PPT导出高分辨率图片的四种方法 2022-09-22
-
2023年最新!国家电网27家省级电力公司负责人大盘点 2023-03-14
-
全国消防救援总队主官及简历(2023.2) 2023-02-10
-
盘点 l 中国石油大庆油田现任领导班子 2023-02-28
-
我们的前辈!历届全国工程勘察设计大师完整名单! 2022-11-18
-
关于某送变电公司“4·22”人身死亡事故的快报 2022-04-26