AI批量删除Excel单元格内容的空格并按字母排序

火山方舟向量数据库大模型

在deepseek中输入提示词:

你是一个Python编程专家,要完成一个Python脚本,完成任务如下:

读取文件:"D:\参考文献.xlsx"

删除第一列所有单元格内容前面的空格,比如这个:“ Vernon Bogdanor (eds.), The Blackwell Encyclopaedia of Political Science, Oxford: Basil Blackwell, 1991, pp. 31.”,删除空格后为:“Vernon Bogdanor (eds.), The Blackwell Encyclopaedia of Political Science, Oxford: Basil Blackwell, 1991, pp. 31.”;

删除第一列所有单元格内容尾部含有“pp”的部分,比如:“Alexander Dugin, Eurasian Mission: An Introduction to Neo-Eurasianism, London: Arktos, 2014, pp. 1.”,应该删除掉“, pp. 1.”;

删除第一列所有单元格内容尾部含有“p”的部分,比如:“ Samuel Huntington, American Politics: The Promise of Disharmony, Cambridge: The Belknap Press, 1981, p. 121.“应该删除掉“, p. 121.”;

注意:每一步都要输出信息到屏幕上

源代码生成如下:

import pandas as pd

def process_excel_file(file_path):

读取Excel文件

df = pd.read_excel(file_path, engine='openpyxl')

print(f"成功读取文件: {file_path}")

获取第一列数据

first_column = df.iloc[:, 0]

print(f"第一列共有 {len(first_column)} 个单元格。")

删除第一列所有单元格内容前面的空格

first_column = first_column.apply(lambda x: x.lstrip() if isinstance(x, str) else x)

print("已删除第一列所有单元格内容前面的空格。")

删除第一列所有单元格内容尾部含有“pp”的部分

first_column = first_column.apply(lambda x: x.rsplit(', pp.', 1)[0] if isinstance(x, str) and ', pp.' in x else x)

print("已删除第一列所有单元格内容尾部含有“pp”的部分。")

删除第一列所有单元格内容尾部含有“p”的部分

first_column = first_column.apply(lambda x: x.rsplit(', p.', 1)[0] if isinstance(x, str) and ', p.' in x else x)

print("已删除第一列所有单元格内容尾部含有“p”的部分。")

将处理后的数据更新回DataFrame

df.iloc[:, 0] = first_column

保存修改后的Excel文件

df.to_excel(file_path, index=False, engine='openpyxl')

print(f"文件已保存: {file_path}")

if __name__ == "__main__":

file_path = r"D:\参考文献.xlsx"

process_excel_file(file_path)

picture.image

运行结果如上

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动云原生降本增效实践
本次分享主要介绍字节跳动如何利用云原生技术不断提升资源利用效率,降低基础设施成本;并重点分享字节跳动云原生团队在构建超大规模云原生系统过程中遇到的问题和相关解决方案,以及过程中回馈社区和客户的一系列开源项目和产品。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论