本文将带领了解Python编程语言的基础知识以及Numpy库的使用,Numpy是数据科学中处理数据格式的关键库,它能够帮助从数据中提取有价值的信息。
在深入探讨Numpy之前,先来了解一些Python的基本概念。
解释器是一种程序,它读取并执行源代码、预编译代码和脚本。它还管理机器上的编程语言的模块/包。
使用虚拟环境时,在项目中添加或删除包只会影响虚拟环境。而使用现有解释器时,所有更改都会影响系统范围内的解释器,这些更改将在所有使用该解释器的项目中可用。
Pip是用于安装和管理Python编写的软件包的标准包管理系统。
以下是在命令提示符/终端中运行的Pip的各种命令:
pip list
- 列出所有包
pip install package_name
- 安装包,例如:pip install Numpy
pip uninstall package_name
- 卸载包
pip search package_name
- 搜索包
变量用于存储信息,以便在程序中引用和操作。在Python中,不需要在声明时显式提及数据类型。字符串变量不能通过数学操作进行操作。
有以下基本操作:
+
(加法);-
(减法);*
(乘法);/
(除法);%
(取模,即除法的余数);**
(幂,即a的b次方);//
(向下取整除法,即除法的整数部分)。
索引是从0开始的每个字符的位置。切片是从字符串值或单词或句子中获取子字符串。例如,如果有一个字符串变量存储“保持积极”,下面的代码片段展示了索引和切片的例子。
可变性意味着可以在创建对象后更改其值,而不可变性意味着一旦创建对象,就不能更改。
以下是Python中的不同类型的数据结构: 9.1) 列表:这些数据类型以顺序方式将不同/相同数据类型的元素保存在一起。它们被方括号[ ]包围,是可变和可索引的,也允许重复。列表有许多方法,如list.append(),list.pop(),list.reverse()等,用于执行各种列表操作。 9.2) 元组:它们与列表相似,有两个主要区别,即它们被圆括号()包围,并且是不可变的。元组有两个内置方法可以使用:index()和count()。 9.3) 集合:集合是一个无序的数据集合。集合被大括号{}包围,是不可变和不可索引的。集合不允许重复元素,与允许重复元素的列表或元组不同。 9.4) 字典:Python中的字典是一种数据结构,它将值存储在其键的对面。它被大括号包围,键值对即{key1:val1}。
常用的库包括: Numpy - 用于以数组形式存储数据并执行数值运算。 Pandas - 主要用于存储数据集和数据操作。 Matplotlib - 用于绘制图表、直方图等,以便更好地理解数据。
虽然两者都用于以数组形式存储数据,但Numpy更好,因为它占用的内存更少,而且Numpy数组比列表更快。
当然可以,这是Numpy数组的另一个关键特性。