首页 > 生活 > 娱乐

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)

时间:2023-03-29 18:01:06 作者: 阅读:0

--凡事勤则易,凡事惰则难,学习编程成就更好的自己--

Python语言简洁生动,特别适合文科生学习入门IT世界,用几十行代码就能够做一个完整的爬虫脚本,开发效率杠杠的!短时间内即可解决工作和学习中碰到的各种棘手问题。(本人外语专业毕业,机缘巧合爱上编程,自学道路曲曲折折,痛并快乐!)在这里总结一下自学Python遇到的难点和重点,分享码过的代码和要点总结,希望能够给初学者一点启示和鼓励,同时愿意结交更多大神交流有助提升自己的水平。

今天分享的知识点是:如何按指定条件筛选和抽取数据样本,因为平时在做数据处理和分析工作中,往往需要按某些字段特征进行筛选和提取目标数据集,下面用一个有趣的案例来展开说明:

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(1)

通过观察得知该数据集合共有13个样本,接下来看看如何钻取得到想要的目标数据集吧:

首先在Jupyter Notebook环境下读取和查看数据:

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(2)

任务1.提取性别为女的数据

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(3)

任务2.提取母语/方言为广东话和英语的数据

使用了isin方法,注意括弧里输入列表

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(4)

任务3.提取评级中排除“无年终奖”的其他剩余数据

使用~符号进行反选数据,这种方法更加简单高效

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(5)

任务4.提取性别为男且工龄大于等于20年的数据

注意用“&”符号表示且关系即是取交集,每个条件单独用()限定好

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(6)

任务5.提取姓名中包含有“小”字的数据

注意一定使用str.contains这个表达式

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(7)

任务6.提取姓名中包含有“小”字且性别是女的数据

大家是不是感觉越来越好玩了,其实也不是特别难!!!

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(8)

任务7.提取年龄在30岁到50岁之间的数据(包含30和50)

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(9)

任务8.提取姓名中包含有“小”字或绩效考核成绩大于等于90的数据

注意用“|”符号表示或关系即是取并集,每个条件单独用()限定好

python筛选数据方法(文科生自学Python-按条件筛选和抽取数据样本)(10)

代码如下:

import pandas as pd import os def Set_Work_Path(x): try: os.chdir(x) route = os.getcwd() return route except Exception: print("No Result") work_path = r"E:\DATA\03AUG21" Set_Work_Path(work_path) data = pd.read_excel("Sample.xlsm",sheet_name="DATA-Python",header=0,index_col=None) display(data) #select data with female in sex field data_female=data[data["性别"]=="女"] display(data_female) #select data with dedicated languages or dialects data_female=data[data["母语/方言"].isin(["广东话","英语"])] display(data_female) #select data without yearly bonus data_without_bonus=data[~data["评级"].isin(["无年终奖"])] display(data_without_bonus) #select data with male in sex field and work over 20 years data_male_over_10_job_years=data[(data["性别"].isin(["男"]))&(data["工龄"]>=20)] display(data_male_over_10_job_years) #select data with name containing little in Chinese data_with_little_in_name = data[data["姓名"].str.contains("小")] display(data_with_little_in_name) #select data with name containing little in Chinese and also female data_with_little_in_name_female = data[(data["姓名"].str.contains("小"))&(data["性别"].isin(["女"]))] display(data_with_little_in_name_female) #select data with age in a period data_work_bio_age = data[(data["年龄"]<=50)&(data["年龄"]>=30)] display(data_work_bio_age) data_with_little_in_name_good_performance = data[(data["姓名"].str.contains("小"))|(data["绩效考核成绩"]>=90)] display(data_with_little_in_name_good_performance)

END

我为人人,人人为我!!欢迎大家关注,点赞和转发!!!

~~人生不是赛场,梦想不容退场~~不断努力学习脱变出一个更好的自己,不断分享学习路上的收获和感悟帮助他人成就自己!!!

,

图文新闻

相关文章

热门资讯

评论

1111111

更多推荐

三星one ui4.0和3.1哪个好(小窗功能哪家好用)
三星one ui4.0和3.1哪个好(小窗功能哪家好用)

对于当前的智能手机的使用体验,发现身边越来越多的人不光是只看硬件水平了,而是把系统体验作为选择手机的重要标准,这方面国产手机

2023-03-29
win10系统初次开机流程(win10首次进系统操作步骤)
win10系统初次开机流程(win10首次进系统操作步骤)

许多对win10系统不太了解的新手,在首次进入系统时,常常会遇到许多问题,今天就给大家讲解下win10首次进系统操作步骤。 注意:首次

2023-03-29
怎样快速压缩大小(几个压缩方法介绍)
怎样快速压缩大小(几个压缩方法介绍)

如何压缩视频呢?相信很多朋友们在给别人传输下载好的视频时都发现了对于一些容量比较大的视频不仅传输得很慢,而且在传输过程中稍

2023-03-29
河南省直机关杰出青年排行榜前10名
河南省直机关杰出青年排行榜前10名

河南省直机关杰出青年排行榜前10名分别是:王学海、徐国防、刘中伟、王静(杰青)、姜慧、方先珍、郑方、唐国斌、赵勇(杰青)、双瑞。.1

2023-03-29
环境监测数据造假的认定(篡改伪造自动监测数据)
环境监测数据造假的认定(篡改伪造自动监测数据)

环境监测数据造假的认定?核心阅读本报记者 张维,下面我们就来说一说关于环境监测数据造假的认定?我们一起去了解并探讨一下这个问

2023-03-29
清除手机灰尘的声波(播放一段声音就可以给手机清灰尘)
清除手机灰尘的声波(播放一段声音就可以给手机清灰尘)

手机用久了,因为静电和日常使用等原因,会发现麦克风和扬声器处积灰严重,导致听筒或者杨声音声音小,然而我们普通消费者没有专业工具,

2023-03-29
三星ssd 990(三星990PRO固态硬盘体验)
三星ssd 990(三星990PRO固态硬盘体验)

说起2022年最难忘的事,对我而言,莫过于在年底影视工业网举办的由三星存储冠名的第五届影视调色PK赛中获得了第一名。这是我学习中

2023-03-29
三星手机如何开启悬浮窗设置(三星手机使用小技巧)
三星手机如何开启悬浮窗设置(三星手机使用小技巧)

之前在三星Fold4的评测中,相信大家对折叠屏手机的大屏分屏和小窗功能印象深刻,因为它能让一块屏幕同时运行多个App,让我们能一屏多

2023-03-29
江西温泉推荐排行榜前10名
江西温泉推荐排行榜前10名

江西温泉推荐排行榜前10名分别是:江西明月山维景国际温泉度假酒店、明月山天沐温泉度假村、庐山西海国际温泉度假村、星子庐山龙

2023-03-29
电脑上的c盘怎么清理简单的(电脑C盘怎么清理到最干净)
电脑上的c盘怎么清理简单的(电脑C盘怎么清理到最干净)

如果你的电脑C盘运行内存已经快满了,这个时候你怎么处理?让我们来看看如何清理C盘。 c如何清理盘: 方法一:存储状态 1.

2023-03-29
返回顶部