-
-
1
-
3
-
4链家杭州二手房网页 #加载所需的包: library("xml2") library("rvest") library("dplyr") library("stringr") #对爬取页数进行设定并创建数据框: I <- 1:100 house_inf <- data.frame() #利用for循环封装爬虫代码,进行批量抓取: for (i in 1:100){ #发现url规律,利用字符串函数进行url拼接并规定编码: web <- read_html(str_c("http://hz.lianjia.com/ershoufang/pg", i), encoding = "UTF-8") #提取房名信息: house_name <- web%>%html_nodes(".houseInfo a")%&
-
1最近刚结束了一个可视化的在线课程,教的都是基础的统计图表。授课过程中,发现学员对于统计图的规范确实没有什么概念,尤其是统计图的纵坐标。 在讲授折线图的时候,我留了一个作业,要求学员绘制北京每周平均房价的折线图,纵坐标分别从0和从60000开始。同时,要求学员评价这两个统计图,应该选择哪个在报告中汇报。读者也可以思考一下,要是你会选择哪个统计图? 再来看一个类似的问题。这是一组柱状图,绘制的是不同性别、不同职
-
2狗熊会在10月底邀请大家进行“颜值”打分,我们收集到了103143份打分,非常感谢大家的支持,现在我们将这个数据集分享给大家(但是数据质量确实不太好,请大家留心)。 另外,有12位热心朋友,为我们贡献了1000+打分数据,为了表示感谢,狗熊会特别赠送布丁老师的力作《R语言:从数据思维到数据实战》(签名版)! 详细数据登录狗熊会平台查阅~
-
3
-
1
-
1建模前的准备 建模之前的准备工作,包括数据的预处理、数据的降维等探索性分析。数据的预处理包括缺
-
0经核实吧主liuran0527 未通过普通吧主考核。违反《百度贴吧吧主制度》第八章规定http://tieba.baidu.com/tb/system.html#cnt08 ,无法在建设 狗熊会吧 内容上、言论导向上发挥应有的模范带头作用。故撤销其吧主管理权限。百度贴吧管理组
-
1不知不觉,寒假就要来啦,美美的寒假生活:不用早起,没有课程和作业,还有满格的wifi。 可玩手机不仅会使眼睛干涩,还会消磨人的意志。那么做个寒假计划怎么样呢?注意了,要放大招了哦。让大家看看我2018年末做的寒假计划,本熊放假前也是信誓旦旦,放假后…… 所以,本熊今年打算重新来过,咸鱼翻身,为自己制定了一份严密的寒假计划。 对于大家有怎样的寒假规划,本熊也是十分好奇呢,为了了解大家的寒假规划,也希望为还没有寒假
-
02019年暑假,一部名为《长安十二时辰》的古装悬疑正剧横空出世。该剧主要讲述了唐朝上元节前夕,长安城混入可疑人员,死囚张小敬(雷佳音饰)临危受命,与少年天才李必(易洋千玺饰)联手在花灯大会前抓住搞破坏的刺客,阻止破坏的发生,解救了长安城中的黎明百姓。 宣传海报(图片来源:官方微博) 《长安十二时辰》在给予观众难得的惊喜感和新鲜感的同时,也赢得了业内的广泛认可与好评,成为当之无愧的口碑大剧。猫眼专业版的数据
-
1在对数据进行分析之前,需要对数据做一些预处理,包括数据分割、缺失值处理、删除近零方差变量、删除高度线性相关变量、数据标准化。 读入数据 第一步是读入数据,对数据进行初步了解。下面以小说《三生三世十里桃花》中的人物信息为背景,具体的变量解释表如表1所示,其中因变量Y为“决定”这个变量。 表1 变量说明表 分割训练集和测试集 数据拿到之后,要先划分训练集和测试集。测试集是黑盒子,是不能触碰的炸弹,所做的任何处理,
-
1作为多年(具体多少年就猜吧,说多都是泪!)“母胎solo”的本熊要燃烧我强大的八卦之魂啦,这次我们来聊聊甜甜的大学恋爱。感情这个奇妙的东西,也许是世界上最撩拨人心弦的事物了吧。大学的我们,正值情窦初开的年龄,丢掉了高考的包袱,多了无限的自由时间,校园生活中共同学习、生活和交流过程中,兴趣爱好、思想观念相同的同学们组成各种各样的学生组织……这形形色色的人中,一定有你想要冲破荆棘,共同扶携,互换余生的人吧
-
0背景介绍 房地产市场主要包括有一手房地产,二手房地产以及租赁市场,其中二手房地产起着一手房地产与租赁市场的纽带作用。随着二手房市场的逐渐放开,进入市场的二手房数量不断增加,二手房交易规模也不断扩大。二手房交易相对复杂,涉及的相关政策较多,其市场体系也处于进一步发育与完善阶段,再加上二手房本身又具有不同于新开发房地产商品的许多特征,使二手房交易环节更多、程序更加复杂,风险也较大。 二手房市场在我国起步
-
12014年国务院出台《社会信用体系建设规划纲要(2014—2020年)》。紧接着各地政府都在积极推进相关的社会信用体系建设,这是一项非常有意义的工作。但是,在具体实施中,各地采取的具体措施各不相同。据互联网媒体报道,北京市尝试将路侧停车逃费行为与征信挂钩;西安将拒不履行生活垃圾分类义务的个人行为信息将被纳入个人征信系统;深圳规定在地铁一年内三次逃票行为将被纳入征信系统;浙江省拟将恶意频繁跳槽纳入个人征信;而国家卫
-
1如果要猜一种生理反应,是每个人都曾经历过的,我想熬夜便是首选。当夜幕降临,天空泛起零星,当我们卸下了一天的疲惫,本该用最大的热情去拥抱一张温暖的床,去享受眼睛闭合到睁开的过程,来舒缓我们这一天的疲劳。然而这漫漫长夜却成了一些人“狂欢”的开始,而且情况愈演愈烈。演员高以翔熬夜录节目猝死,我们为这位优秀演员的陨落感到惋惜痛心,同时也在心中敲响了熬夜恶果的警钟。如果说赖床是没有勇气开始这一天,那么熬夜就
-
0经过了半个月的数据收集,答应熊粉们的盲盒数据终于来了。本次问卷共有446人参与调查,其中351人听说过盲盒,122人购买过盲盒。可以发现超过四分之三的受访者听说过盲盒,但真正为盲盒“氪金”的只有其中的(听说过的)三分之一左右。让我们具体看看盲盒到底有着什么样的魔力吧!欢迎登陆公号看分析~
-
0
-
1经典理论学习路线适合想要进入数据科学相关领域工作、但没有系统学习过任何数据科学分支学科的学员;也适合从事过具体的建模和分析工作,需要通过理论体系来整合经验、提升数据思维的学员。 《统计学理论精要》是经典理论学习路线的核心课程。这门课的主要目标是帮助大家建立一个思考数据问题的框架,告别在数据里“随机游走”的工作方式。开工那一天老师就会给你提个问题,并且光速告诉你答案:统计学是研究什么的?不确定性!然
-
0经常听到学习数据科学的年轻朋友说,他们未来的职业理想是成为一名数据科学家,想知道应该怎么做。对此我想说:首先,对于从事数据相关职业的人来说,我们有很多职业发展路径可以选择,并不是每一条都指向数据科学家;其次,数据科学家也不一定是适合每个人的选择。有这样一个美好的远景目标非常好,不过也不妨同时把眼光放得稍微近切一些,看看我们还可以有哪些选择?下一步又应该迈向哪里? 要回答这些问题,我们要先简单梳理一
-
0
-
1
-
1金融的核心是风控,信用评估模型对风险控制至关重要。狗熊会在征信模型、信用评估领域有着丰富的业务实践经验,与多家征信、金融、大数据等机构开展了长时间的深度合作。狗熊会新一期“征信评分模型”主题项目即是从狗熊会长期的业务实践中提炼总结而来,借助狗熊会在线实习这样一个高效提升自我的快捷形式,由小丫老师带领学员体验从数据到信用评分产品的全部流程,让学员深度了解信用评分在金融风险管理中的作用,在实战中快速提
-
0
-
3玫瑰象征爱情和真挚纯洁的爱,人们多把它作为爱情的信物,是情人间首选花卉。不同颜色、不同的数量
-
3
-
2为了各位小伙伴(未来)在职场更好地生存,在学校更好地进步,撰写报告是必备技能。从规范到内容,一份好的数据分析报告能够让你更好地跟同事、老板、客户、导师沟通;相反,一份很差的报告能够很容易地毁掉项目、甚至影响你的职业前途。那么如何才能写出好的分析报告来呢? 请来直播间,免费分享!
-
0
-
1近年来,多所高校接连开设了数据科学与大数据技术专业,与数据科学相关的案例教学需求急剧增加。为了帮助高校教师更好地开展案例教学,加快学科建设,联合山西财经大学统计学院于2019年5月10日举办第七期案例教学与产业实践培训。 此次培训的主要内容包含以下方面: 1. 数据科学的案例教学。演讲嘉宾将分享狗熊会的数据科学产品,尤其是用于支持案例教学的精品案例库,以及案例教学的一些授课技巧和示例。 2. 数据科学产业实践。狗熊会
-
2一年一度的毕业季正在来临,同学们伤感离别,同时又在期待新的人生之路,作为职场小白,你知道纵横职场数年风光的必杀技是什么吗?没错,是一个漂亮的ppt,一份严谨有说服力同时美观的分析报告。
-
2
-
0为促进我国统计学发展和青年统计学者的学术交流,经全国工业统计学教学研究会2017年第一次会长办公会提议,第九届理事会第一次会议审议通过,决定成立全国工业统计学教学研究会“青年统计学家协会”(以下简称“协会”)。 协会旨在促进青年统计学家的交流,定期举办中国青年统计学家年会论坛。协会成立大会暨中国青年统计学家年会论坛已定于2019年4月19日在上海财经大学举办,会议邀请了数位在学术界和业界的优秀青年统计学家作为主旨
-
0经过一个月的高强度实训,47位同学顺利结业,同学们感慨万千,没想到一个月能学这么多内容,有的同学意犹未尽继续报名了第二期实习任务。
-
0
-
2亲爱的小伙伴们,咱们新一期在线实习项目与大家见面啦~
-
2
-
0狗熊会目前已经出版了3本数据科学教育教学教材,都已经被国内各大高校使用,今天再给大家推荐一本教材,以数据科学中最基础的统计理论和方法为授课内容,并结合实际问题背景,辅之以R语言操作方法,使得统计学易于理解与应用。
-
1
-
2现在水妈正在和大家分享如何撰写一份精美的数据分析报告,欢迎学习交流~
-
1一年一度的招聘热季启动,这里分享一个平台,供即将毕业或者转行做数据分析的朋友们参考,我们本年度正式启动了个人在线实习项目,可以迅速为职场小白打开数据分析的大门,掌握学习方法论,无论是就业、转行还是升学都有裨益。
-
2在线实习第一期SEM已经开课3天啦,学员们正在认真研究老师布置的第一个task任务:对国内互联网广告、SEM广告的发展有所把握,学员们也遇到了一些难题。 咱们来看看一位童鞋提出的这个非常具有普遍性的问题:实现数据价值要懂业务,懂业务包括了解行业和竞品,了解行业和竞品常常会使用到二手数据。当各来源的数据互相冲突的时候,我们要怎么判断和取舍呢?
-
1又到了一年毕业季,每到毕业季,面临工作抉择,还有很多不知道如何应对面试环节,总是心里有些触,觉得底气不足,在线实习专家今天为大家分享SEM的数据分析全环节,助力有意想在这一领域发展的小伙伴。
-
4
-
2
-
1来我们平台学习,多种方式参与!
-
2数据分析是一个实践性很强的专业领域,单靠课堂知识是远远不行的,只有结合项目实践才真正能提升专业能力,实习是必经阶段,但是好的实习单位有限,在线实习不失是一个好的方式。 给大家分享狗熊会的在线实习项目,效果不错。
-
1
-
1新年新气象,为了更好地促进数据科学爱好者(尤其是在校生)的相互学习交流,狗熊会2019年将推出新专栏《狗熊会商业分析评论》,重点面向数据科学相关专业(例如:经济、金融、管理、统计学、应用数学、计算机等)的在校生。 如果您是一个在校生,这学期上了一门跟数据分析相关的课程(例如:营销模型、深度学习、回归分析、量化投资等),并辛苦努力产生了一份优秀的数据分析报告。作为一个课程的项目报告,虽然精彩绝伦,非常有趣