目前的互联网已经迈入大数据时代,通过对海量的数据进行分析,能够产生极大的商业价值。如果我们需要大量数据,有哪些获取数据的方式呢?常用的方式主要有以下5种。 查看全文>>
Python+大数据技术文章2021-01-27 |传智教育 |网络爬虫获取数据的方式, Python爬虫
字符串是一种表示文本的数据类型,字符串中的字符可以是ASCII字符、各种符号以及各种Unicode字符。Python中的字符串有如下三种表现方式。第1种方式:使用单引号包含字符。示例代码如下: 查看全文>>
Python+大数据技术文章2021-01-27 |传智教育 |什么是字符串,怎样添加字符串
斐波那契数列(Fibonacci sequence),又称黄金分割数列、因数学家莱昂纳多·斐波那契(Leonardoda Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”。斐波那契数列指的是这样一个数列 0, 1, 1, 2, 3, 5, 8, 13,特别指出:第0项是0,第1项是第一个1。从第三项开始,每一项都等于前两项之和。 查看全文>>
Python+大数据技术文章2021-01-18 |传智教育 |斐波那契数列,Python代码实现斐波那契数列
前期采集到的数据,或多或少都存在一些瑕疵和不足,比如数据缺失、极端值、数据格式不统一等问题。因此,在分析数据之前需要对数据进行预处理,包括数据的清洗、合并、重塑与转换。Pandas中专门提供了用于数据预处理的很多函数与方法,用于替换异常数据、合并数据、重塑数据。 查看全文>>
Python+大数据技术文章2021-01-18 |传智教育 |数据清洗,数据清洗操作步骤
MySQL属于关系型数据库,Mongodb属于非关系型数据库,两者有不同的特点,为什么选择Mongodb而非MySQL存储爬虫数据呢?本节课就对这一问题做详细解答。 查看全文>>
Python+大数据技术文章2021-01-18 |传智教育 |Mongodb,MySQL,python面试题
Python中的模块可分为三类,分别是内置模块、第三方模块和自定义模块,相关介绍如下。 查看全文>>
Python+大数据技术文章2021-01-18 |传智教育 |Python模块
程序被执行后成为了一个活动的实体,这个实体就是进程。换言之,操作系统调度并执行程序,这个“执行中的程序”称为进程。进程是操作系统进行资源分配和调度的基本单位。一般情况下,进程占据的内存空间由控制块、程序段和数据段三个部分组成,各部分的介绍如下。 查看全文>>
Python+大数据技术文章2021-01-08 |传智教育 |进程,Python进程内容
在Python中,具有特殊功能的标识符称为关键字,每个关键字都代表不同的含义,Python语言自己已经使用它们,不允许自己定义和关键字相同名字的标识符,开发者应该尽量避开这些关键字。Python中的关键字如下所示: 查看全文>>
Python+大数据技术文章2021-01-07 |黑马程序员 |关键字,标识符