数据挖掘
-
一文带你了解什么是数据挖掘
大数据时代已经来临,利用网络和生活中产生的大量数据发现问题并创造价值,使得数据挖掘成了一门新的学科和技术。那么什么是大数据...
2019-07-24 23:46:01 -
数据科学家都应该知道的5个统计学知识
今天,我们将分享5个对于数据科学有用的统计学方法。这些不是过分抽象的概念,而是相当简单、有长期适用性的技术。...
2019-07-24 23:44:00 -
能够简化数据科学的6种工具
新的工具捆绑了数据清理,拖放式编程以及云计算,可以帮助任何熟悉电子表格的人充分利用数据科学的力量。...
2019-07-24 23:42:42 -
大数据的一个时代的结束了,Hadoop还值得你学习
Hadoop从诞生至今已经十三年了。2006年诞生大数据,2008年成为Apache的顶尖项目,成为国内外互联网大数据的标准配置之一。长久以来,想要入...
2019-07-24 23:42:03 -
用Python操作Word文档
本文主要讲解python中操作word的思路。...
2019-07-23 22:45:17 -
十五个点,理解Apache Kafka
Kafka在世界享有盛名,大部分互联网公司都在使用它,那么它到底是什么呢?让我们一步一步地来理解他,随后深入探讨其工作原理。...
2019-07-23 22:44:44 -
三行Python代码,可以让你的数据处理快别人4倍
Python是一门非常适合处理数据和自动化完成重复性工作的编程语言,我们在用数据训练机器学习模型之前,通常都需要对数据进行预处理,...
2019-07-23 22:44:33 -
运维老司机总结:最常用的150个命令
说到运维大家总是想到的是修网络的,其实就修网络的学问也是很大的,现在来听听一位老运维总结下在运维工程中,常用的150个命令汇总...
2019-07-23 22:44:10 -
文档数据库鼻祖MongoDB:一直被模仿,从未被超越
“中国已经超越美国,成为全世界下载MongoDB次数最多的国家。” MongoDB全球渠道及亚太区销售高级副总裁Alan Chhabra在2019 MongoDB中国用户大会...
2019-06-24 23:02:26 -
Hadoop 不再权威,开源大数据的未来何去何从?
屈指算来,Hadoop 已经诞生 13 年了。它最早诞生于 2006 年,并在 2008 年成为 Apache 顶级项目。诞生后没过多久就成为了互联网行业大数据计算...
2019-06-24 23:01:40 -
三家 Hadoop 厂商衰落启示:云大数据是颠覆者吗?
今年 5 月底,MapR被曝融资困难,可能在不久之后关闭,这个曾经估值高达 10 亿美元的 Hadoop 赛道的有力挑战者或将就此衰落。随后,同样围...
2019-06-24 23:00:03 -
流式数据处理在百度数据工厂的应用与实践
流式数据处理在百度数据工厂的应用与实践...
2019-06-20 23:55:57 -
如何基于 Apache Pulsar 和 Spark 进行批流一体的弹性
在大规模并行数据分析领域,AMPLab 的『One stack to rule them all』提出用 Apache Spark 作为统一的引擎支持批处理、流处理、交互查询和机器学习等...
2019-06-20 23:55:47 -
当你打开天猫的那一刻,推荐系统做了哪些工作
天猫首页作为用户打开手机天猫 App 的第一印象,所推荐的商品极大地决定了用户接下来的行为,对用户流量的承接与分发、提升用户购物体...
2019-06-20 23:55:33 -
如何可视化BERT?你需要先理解神经网络的语言、
Google AI 的 People + AI Research(PAIR)团队近日发布的论文《Visualizing and Measuring the Geometry of BERT》提出了一种可视化和度量 BERT 的几何性质的方法。...
2019-06-16 23:10:36