数据库指南:一文让你浅显易懂地了解数据库

时间:2022-10-10 18:23:06 | 浏览:1316

在数据分析的技能中,数据库与SQL会是性价比最高的技能之一。数据库是逻辑上的概念,它是一堆互相关联的数据,放在物理实体上,是一堆写在磁盘上的文件,文件中有数据。这些最基础的数据组成了表(table),我们把它想象成一张Excel的sheet

在数据分析的技能中,数据库与SQL会是性价比最高的技能之一。

数据库是逻辑上的概念,它是一堆互相关联的数据,放在物理实体上,是一堆写在磁盘上的文件,文件中有数据。这些最基础的数据组成了表(table),我们把它想象成一张Excel的sheet。

数据表的抽象概念如上图。

ID是数据库中重要的概念,叫做唯一标识符/主键,用来表示数据的唯一性。我们把它理解成数据的身份证号。我知道身份证,也就知道数据在哪里了。

ID不会有现实的业务意义,就是一串单纯的数字,每张表只能有一个主键。

数据库是表的集合,一个数据库中可以放多张表,我们给每张表命名,表与表之间能互相联系。

联系就是数据能够对应匹配,正式名称叫联接,对应的操作叫做Join,我们想象成Excel中的vlookup。

上面就是两张表,用户和教育背景,看上去能够使用姓名进行匹配,可是这里出现了两个张三,一个是北京大学,一个是上海大学,究竟哪个张三才能和用户表的张三对应上?都不能。

也许清华大学还有张三,复旦大学,交通大学也有,毕竟全中国姓名相同的人那么多。正确的用法应该是使用ID联接,而不是姓名。ID是产品、运营和数据人员们在工作中接触最多的内容之一,用户ID文章ID商品ID等,如果大家还不了解,这里需要掌握。

上图就是正确的用法,用户表和教育表能够通过ID联接,可能有人疑问,用户ID为1和6的,还是不能对应呀?这个不要紧,因为在数据库中,不是所有的表都能一一对应,存在部分匹配的可能性,也许那个叫秦路的,他没读过书,教育背景表中自然没有记录了。

当然,数据库的设计还要更严谨,一般每张表都会有主键(主键不是必须,但是从效率优化上肯定会加),这个主键也不能是其他表的主键,防止产生冲突。

这样就靠谱了,用户ID是用户表的主键,教育背景ID是教育背景表的主键,我们在教育背景表中加入一个字段叫用户ID,它是专门用来联接用户表的,它不是主键。

是不是有点绕?实际上,并不是所有名字带ID的都叫主键,这一点要搞清楚。

数据库中,表的名字和字段应该是英文。如果是主键,只要叫id即可,你要关联其他表,则以「表名_id」作为联接。

关联后的逻辑如下,这种方式叫全联接,匹配不上的都用Null表示,匹配上的我用橙色表示。联接是关系型数据库中的核心概念,是操作的基础,现在迷糊不要紧,多练习几次就好了。

如果现在我有一张新的表,需要关联education,聪明的你也一定想到方法了吧。

了解上面的概念,你就知道什么叫关系型数据库,简单说,它是由多张能互相联接的二维行列表格组成的数据库。

关系型数据库是基于关系代数模型发展而来。常用的数据库有SQL Server、MySQL、Oracle等,我们后续学习都以MySQL为主。

接下来是安装MySQL。

我们去MySQL的官网下载,版本5.6以上即可。

按照教程完成后,我们通过命令行查询知否成功,Win和Mac的操作不一样。

我们当然不会在这么丑的界面上操作MySQL啦,我们还需要安装GUI,这是为我们提供操作界面的。

Mac用户推荐SequealPro,Win用户推荐WorkBench。后续我会在SequealPro操作。MySQL的默认用户名和密码均是root,建议重新设置一下。

如果大家有疑问,可以去网上搜索相关教程,不安装MySQL也是可以的。因为数据分析师大多数情况是用在线数据查询平台操作,安装只是为了方便演示。不想要安装的同学,可以在SQLZoo练习,以后我也会讲解。

输入账号密码后进入操作界面,数据库我命名为qin。左侧栏是数据库中的Table列表,现在为空。右侧是表相关的操作和信息。

因为现在没有数据,我们需要加载数据,选择以前爬虫爬下来的数据加载。数据分析不需要学习如何创建删除增改表的操作,因为用不到,我只会讲解查询,大家有兴趣可以自行了解。

任何MySQL的GUI工具,都能加载CSV,一般叫import。

Encoding选择Autodetect,其余按默认。

接下来需要设置各字段的数据类型,系统会帮我们自动选上,这里不用改动。int代表整数数值,varchar代表字符串(中文英文标点符号这类),括号里面的数字是允许存储字节,这块也不要深入理解,只要知道常用的字段类型即可。

给表取个名字,载入后,就将CSV成功导入到数据库了,能够进行数据查询的操作。

这张表没有设置主键,主要是练习,所以跳过了这一步骤。

大家可能会遇到导入的数据是乱码,这是系统编码之间的差异,是utf8和gbk之间的冲突,网上有相关解答,搜索关键词即可。

到这里,大家已经成功地在自己电脑上创建了数据库。接下来可以使用SQL做练习。开启select * from DataAnalyst 的查询。

如果需要原始数据的话,去百度云盘下载:下载密码:6x2v,是5000条数据分析师的岗位数据。

作者:秦路,微信公众号ID:tracykanc

本文由 @秦路 原创发布于人人都是产品经理。未经许可,禁止转载。

相关资讯

这个变化你要了解!30日起,来T1航站楼接机的车辆请到停车场候客

今晚零时(11月30日)起,因新白广城际轨道机场段T1站施工需要,白云机场1号航站楼A、B到达区社会车辆接客通道关闭,私家车机场接人需到停车场候客。为方便广大旅客,小编特为您奉上出行攻略:如果您从1号航站楼抵达,接机车辆请选择P1-P5停车

比亚迪放量跌7.3%,比亚迪股份跌近11%,巴菲特“部署减持”?一则数据引担忧

受益于新能源汽车的浪潮,比亚迪A股股价在今年5月10日至6月10日期间,累计大涨50%,其总市值也在6月10日午后一举突破一万亿元关口,不过经过一段时间的高位盘整,近日比亚迪出现一波明显的调整。今日早间,比亚迪在A股及港股均出现大幅下跌。其

销售数据暴增催动比亚迪股价连续反弹低毛利待解

5月26日,比亚迪A股股价报收286.64元,微跌0.19%,总市值达到8344亿元。在大盘震荡时刻,比亚迪的股价却逆势反弹,逐渐向2021年的最高点进发。4月以来,截至5月26日晚,比亚迪股价已累计上涨23.84%,最高时曾达到304.0

吃了大亏来提醒你们:谁说实木地板一定好?实木复合地板了解一下

吃了大亏来提醒你们:谁说实木地板一定好?实木复合地板了解一下新房装修,卧室肯定得铺地板!地板的脚感质感观感都是瓷砖比不了的,当然价格比瓷砖也贵不少!不少土豪家庭也开始想着贴全屋地板,让新房更有家的味道!说道地板那肯定离不开一个经典问题,地板

选实木还是板材……了解这些很重重重要

在装修时,每个人心中都会有这样的疑问——实木好还是板材好?定制好还是木工好? 哪种板材更环保?这些关乎以后的生活质量,尤为重要。今天,就让小编来为你解答吧!随着定制观念普及,越来越多家庭装修会选择定制部分家具。衣柜、书柜、电视柜、榻榻米等定

9图了解睡眠那些事儿

文旅生活 【9图了解睡眠那些事儿】教育部明确3个重要时间保睡眠 你的睡眠还好吗?夜猫子型、赖床型、缺觉型……这8种失眠情况,你中了哪个?收好这份睡眠知识贴为了好睡眠,转发收藏!来源: 河北省文化和旅游厅

「汪教授分享」睡眠相关的6个问题,你了解吗?

1、我怎样才能睡着?人在被失眠困扰的时候,想得最多的一个问题是"我怎样才能睡着?" 错了,其实,最该想的问题应该是”我为什么睡不着?”你觉得自己活得太累,实际上,很可能只是睡得太晚。估摸着又要失眠了,就问自己三个问题:第一,是什么事情让自己

建议收藏!您真的了解睡眠吗?怎样的睡眠才是健康睡眠?一起来看→

人的一生中有三分之一的时间在睡眠中度过睡眠是一种在生命过程中自然发生的并与清醒时期不断交替的状态与心理和生理功能密切相关对人的健康、生活、学习和工作起着重要作用睡眠的作用有哪些?怎样的睡眠才是健康睡眠呢?睡眠的作用1、消除疲劳,恢复体力2、

关于睡眠的冷知识有哪些?这3个,不妨了解一下

睡眠是我们每天都需要做的事情。睡眠的时间可以占到我们生命中1/3的时间。在经济快速发展的时代,人们的压力越来越大。就会有人经常熬夜,有的难以入睡,睡眠质量非常差,这样就容易造成精神状态降低。有可能会出现心烦焦虑的症状。如果有充足的睡眠,整个

关于睡眠,你要了解的“冷知识”

3月21日是第20个世界睡眠日,今年睡眠日的主题是“动静结合,健康睡眠”。充足的睡眠、均衡的饮食和适当的运动,是国际社会公认的三项健康标准。你知道吗?从睡眠周期和习惯来看,人与人之间存有差异,有百灵鸟型、蜂鸟型、猫头鹰型等分型。你属于哪一种

友情链接

SEO域名抢注宝宝起名网妈妈知道币圈飞猪旅行资讯网NBA赛程网宁德新闻资讯网华友钴业A股宋亚轩歌迷网自行车之家五台山旅游攻略三门峡新闻头条网韩姓取名字大全曲靖新闻头条网奶茶培训网淄博烧烤网电动牙刷评测网豪爵摩托车网德天瀑布旅游攻略
MYSQL数据库应用网-mysql数据库基础知识、Mysql还原数据库、mysql数据库迁移方案、mysql数据库增删改查、mysql数据备份和恢复、mysql数据迁移工具、mysql数据库迁移详细步骤、mysql数据库存储目录迁移、mysql数据库不停机迁移方法、mysql数据备份和恢复、免费mysql服务器、mysql官网免费版安装教程。
MySQL数据库应用 nincu.cn ©2022-2028版权所有