Python做数据分析就一定好吗?
发布时间:2018-12-21 14:21:02浏览次数:1,812 次作者:admin
标签:
Python轻松地集成C、C++、Fortran这样的代码,C写的一些底层用算法封装在python包里后,性能相当高效。Python拥有大量的Web框架,因此用于网站的建设,另一方Python作为解释性语言相对编译型语言更为简单,可以通过简单的脚本处理大量的数据。而组织内部统一使用的语言将大大提高工作效率。
也正因为python是一种解释性语言,大部分编译型语言都要比python代码运行速度快,证明了Python是一门高级语言,生产效率高,效率高了节省的时间多了就能做更多事,况且程序员身上的时间绝对比CPU值钱。拥有好的库,工作的时候也能更加方便有效率。
Python强大的库:
① Numpy
② SciPy
③ pandas
④ SymPy
⑤ TVTK
⑥ matplotlib
⑦ Scikit-Learn
每一种库都有其独特的优点,比如TVTK:数据三维可视化、支持Trait属性;Scikit-Learn:基于python的机器学习库,操作简单、高效的数据挖掘和数据分析等。Python每一种强大的库,都有自己的功能,可对应各种不同的需求,对应灵活。
另一方面,需要数据就需要爬虫,而用Python爬虫爬数据不一定是最好的方式,但效率肯定是最高的,等到了你需要爬数据的时候,遇到的无非是如何做大做壮,分布式爬虫应该怎么做。scrapy这种价值接近0,异步或者多线程搞抓取,一个成熟的基于磁盘的队列库如kafka之类。
有的时候你还得注意爬虫速度的重要,放ec2或者国内的云上跑,很重要的指标是你每一亿网页爬下来成本多少,爬的时候比如4核一个虚拟机节点,inbound用足100mbps。
python一般2个小时就能快速上手,开始写自己的程序. 有很丰富的库,已经实现了各种功能.你只需要把你的数据用各种库函数处理就能得到结果了. 实现同样的功能,C/C++可能要几十上百行,python一般在50行(甚至更少)以内就能做好。
Python用于数据分析不仅仅是它简单好用,库强大,也顺应了时代的需求,马云大大也说过未来是大数据的时代,所以掌握好一门数据收集数据分析的技能,能让你在未来激烈的竞争之中不落下风。