面向电网企业各岗位员工,介绍Python数据分析基础,结合工作应用场景,提升数据分析实操水平。
第一章电网企业数据分析与应用概述
第一节 电网企业数据分析与应用的重要意义
当前社会已经进入互联网时代,信息爆炸、万物互联、数据涌现,各行各业正经历着物联网、大数据、人工智能等一系列新技术浪潮的冲击,数字新技术与经济社会各个领域深度融合,人们的工作、生活方式正在被颠覆和改变, 全球经济向数字经济转型势在必行。党的二十大报告中强调要加快建设“数字中国”, 在此背景下,数字经济已成为我国新一轮科技革命和产业变革的重要引擎,是经济社会高质量发展的核心驱动力。
电网连接着电力生产和消费,是重要的网络平台,是能源转型的中心环节。构建新型电力系统、促进能源清洁低碳转型要求数字技术与实体电网深度融合, 因此,提高电网数字化水平是数字经济发展的必要趋势。新型数字技术崛起,对电能的发、输、变、配、用及监管等各个环节都产生了深刻的影响,在新型电力系统中必将吸纳更多电力数据信息、融合更多数字化新技术。
随着新型数字技术的发展与电网数字化水平的提升,电网将逐渐实现信息化、智慧化、互动化,改变传统能源电力的配置方式,由部分感知、单向控制、计划为主转变为高度感知、双向互动、智能高效。通过数字化转型赋能,能够进一步优化电网业务、拓展新兴业务、对传统电网进行改造升级,实现能源互联互通和共享共济,发挥电网优化能源资源配置作用,助力数字强国建设,服务经济社会高质量发展。
在众多数字技术中,大数据技术对建设新型电力系统起到了重要作用。在大数据技术中,对海量的、多元的电力大数据进行分析,优化电力系统生产运行方式,合理消纳间歇式可再生能源,推动电力工业由高耗能、高排放、低效率向低耗能、低排放、高效率的绿色发展方式转变,引领全社会的低碳用能。通过电力数据与经济数据、政务数据、交通运输数据等外部数据融合,可为社会多个领域提供智能化的服务,促进经济社会发展。
数据也是电网企业保持可持续竞争优势和挖掘潜在机会的重要引擎。一方面,如果企业能够不断地、最大化地获取、开发、加工和利用数据资源,就能实现组织流程、企业业务与数据资源的高度契合;另一方面,企业决策方式也将从依靠管理者经验和直觉的模糊决策转变为数据辅助经验的科学决策。数据不仅能够减少管理者由于信息处理能力不足和决策经验惯性产生的选择偏误, 也能从认知层面重构管理者的数字化思维,从而提高企业运营效率和效益,提升企业的竞争力和盈利能力。
因此,电网企业基层员工都需要掌握一定的数据分析技术,管理者、经营决策人员需要具备一定的数据思维,才能合理地利用数据资源,准确、客观地完成相关企业业务,推动新型电力系统建设,保持企业的竞争优势。本书面向电网企业员工,介绍在电网企业中如何进行基础数据分析,让电网企业员工掌握基础的数据分析技术并具备相关的数据思维。
第二节 Python 在数据分析中的作用
在数据分析和应用领域,Python、R 语言和SAS 等都是非常受欢迎的编程工具。Python 和R 语言都是开源的,普遍应用于多个行业;而SAS 为商业付费软件, 是金融和医疗行业的标准数据分析工具。
数据分析需要和数据进行大量的交互,掌握探索性计算及数据结果可视化等技术。Python 中有大量的第三方库可供使用,目前已有超过15 万个第三方包。相比于R 语言等,Python 具有适合大数据分析的第三方库,比如NumPy、Pandas、Matplotlib、SciPy、Scikit-learn 等可以实现数据统计、数据的可视化、机器学习等功能,从而可以完成不同的数据分析任务。另外,Python 还支持使用TensorFlow、PyTorch 等第三方库实现深度学习、强化学习等高级大数据分析任务。
2017 年,Python 成了年度最受欢迎的编程语言,受到了众多编程人员的青睐。Python 中丰富的库在快速开发时展现出非常大的优势,在大数据分析与应用中都不可避免地使用Python,成为继C++ 和Java 之后的第三大语言。
相比其他编程语言(比如C 语言),Python 开展大数据分析的代码非常简单, 上手容易,非常适合初学者。当我们要完成某个功能,Python 的代码量可能是C 语言的十分之一,如果使用Python 来写程序,工作效率会显著提高。
目录
第一章 电网企业数据分析与应用概述
第一节 电网企业数据分析与应用的重要意义
第二节 Python 在数据分析中的作用
第二章 常用Python 数据处理库的使用
第一节 数据处理库概述
第二节 NumPy 的安装与使用
第三节 Pandas 的安装与常用函数
第四节 Matplotlib 的安装与使用
第五节 其他有关数据处理的Python 库
第六节 综合案例
第三章 Python 自动化办公库的使用
第一节 自动化办公概述
第二节 xlrd 的安装与使用
第三节 xlsxwriter 的安装与使用
第四节 xlwings 的安装与使用
第五节 Python-docx 的安装与使用
第六节 综合案例
第四章 电网企业网络数据获取
第一节 网络数据获取概述
第二节 urllib 的使用
第三节 requests 库的安装与使用
第五章 网络数据解析方法
第一节 网络数据解析概述
第二节 正则表达式
第三节 XPath 相关库的安装与使用
第四节 综合案例
参考文献