当前位置:首页 » 编程语言 » sql使用分析
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

sql使用分析

发布时间: 2023-01-06 05:05:14

‘壹’ sql使用查询分析器创建数据库

1.
create database 商品信息数据库
on primary
(name=‘商品信息数据库',FILENAME='d:\商品信息数据库.mdf',size=10mb,maxsize=50mb,filegrowth=2mb)
log on
(name=‘商品信息日志',FILENAME='d:\商品信息日志.ldf',size=5mb,maxsize=25mb,filegrowth=1mb)
2.
create database Sales
on primary
(name=‘Sales_Data',FILENAME='d:\Sales_Data.mdf',size=20mb,maxsize=50mb,filegrowth=5%)
Filegroup fg1(name=‘Sales_Data2',FILENAME='d:\Sales_Data2.ndf',size=20mb,maxsize=50mb,filegrowth=5%)
log on
(name=‘Sales_log',FILENAME='d:\Sales_log.ldf',size=10mb,maxsize=50mb,filegrowth=5mb)
3.
drop database 商品信息数据库
drop database sales

‘贰’ 如何在EXCEL中使用SQL进行数据处理与分析

在EXCEL中使用SQL进行数据处理与分析步骤有:

工具原料:excel2013版本

  1. 打开“excel”,在“数据”选项卡中,找到“自其他来源”;




    ‘叁’ sql查询分析器的使用

    sad

    ‘肆’ 如何用SQL分析电商用户行为数据(案例)

            

    本文以“淘宝用户行为数据集”的分析全过程为例,展示数据分析的全过程

    ——使用工具:MySQL,Excel,Navicat,PowerBI

    ——分析类型:描述分析,诊断分析

    ——分析方法:漏斗分析,用户路径分析,RFM用户价值分析,活跃/存留分析,帕累托分析,假设验证分析。

    (考虑到阅读体验文章中只放了SQL截图,如需PDF版本,再公众号后台回复“用户行为分析”领取)

    (目录如下)

           

    1.分析流程和方法

    当没有清晰的数据看板时我们需要先清洗杂乱的数据,基于分析模型做可视化,搭建描述性的数据看板。

    然后基于描述性的数据挖掘问题,提出假设做优化,或者基于用户特征数据进行预测分析找规律,基于规律设计策略。简单来说:

    ——描述性分析就是:“画地图”

    ——诊断性分析就是:“找问题”

    ——预测性分析就是 :“找规律”


    在数据分析中有两个典型的场景:

    一种是有数据,没有问题:需要先整体分析数据,然后再根据初步的描述分析,挖掘问题做诊断性分析,提出假设,设计策略解决问题。

     

    另一种是已经发现了问题,或者已经有了假设,这种做数据分析更偏向于验证假设。

     

    2.淘宝用户行为分析

    本次是对“淘宝用户行为数据集”进行分析,在分析之前我们并不知道有什么问题,所以需要先进行描述性分析,分析数据挖掘问题。

    我们首先来看下这个数据集的元数据:

           

    根据以上数据字段我们可以拿用户行为为主轴从纵深方向提出一些问题,然后再从数据中找答案

           

    纵向:

    ——这个数据集中用户的日活跃和周活跃时间有什么规律吗?

    ——在当日活跃的用户次日,三日,四日……还有多少活跃?

    深向:

    ——用户从浏览到购买的整体转化率怎么样?

    ——用户从浏览到购买的路径是怎么样子的? 

    ——平台主要会给用户推送什么商品?

    ——用户喜欢什么类目?喜欢什么商品? 

    ——怎么判断哪些是高价值用户 ? 

     

     

    下面是叮当整理的常用分析方法:      

    我们可以给前面的问题匹配一下分析方法,便于后面的分析:


    为了便于后面的数据分析,在分析之前我们需要先对做一下清洗

    看元数据(字段解释,数据来源,数据类型,数据量……)初步发现问题为之后的处理做准备。

           

    确定缺失值范围,去除不需要字段,填充缺失内容    

    根据元数据格式和后续分析需要的格式对数据进行处理

      


    去除重复值,异常值

    ——去除重复值:并把用户ID,商品ID,时间戳设置为主键

    ——异常值处理:查询并删除2017年11月25日至2017年12月3日之外的数据

         

    查询并删除小于2017-11-25的

    ——验证数据:      


    ——分析思路:

    ——SQL提数:

           

           

    ——Excel可视化:

           

    活跃曲线整体为上升状态,同为周六日,12月2号,3号相比11月25日,26日活跃度更高。

    用户在周六周日相比其他时间更活跃(周六周日为休息日,用户有更多时间)

          

    一天内用户活跃的最高峰期为21点(用户在这个时间段空闲较多)

     

    ——分析思路:

    ——SQL提数:

    列出每用户每天及当天后面又活跃的日期,并创建“活跃时间间隔表”用于后面求次日存留,三日存留……

           

    对“活跃时间间隔表视图”引用进行分组统计,计算每日存留人数并创建视图

    对存留人数表进行计算,统计活跃用户留存率

    ——Excel可视化:

           

    ——分析思路:

    ——SQL提数:

    -把各种用户行为分离出来并创建视图方便后续查询用户行为数据

    查询整体数据漏斗

    ——Excel可视化:

           

    用户从浏览到购买整体转化率2.3%,具体主要在哪个环节流失还需要再细分用户路径分析

     

    ——分析思路:

           

    ——SQL提数:

    ——PowerBI可视化:

           

    用户从浏览到购买的路径主要有4条,路径越长转化率越底

    路径1:浏览→购买:转化率1.45%

    路径2:浏览→加购物车→购买:转化率0.33

    路径3:浏览→收藏→购买:转化率0.11%

    路径4:浏览→收藏→加购物车→购买:转化率0.03%

    ——分析思路:

    ——SQL提数:


    ——Excel可视化:

           

    ——描述性分析:

    浏览量top100的商品浏览量呈阶梯分布,越靠前的阶梯之间的落差相对越大在这个阶梯中的商品越少,越靠后商品浏览量阶梯之间的落差相对越小,同阶梯内的商品越多。

    浏览量TOP100的商品所属类目中,4756105,3607361,4357323三个类目浏览量远超其他类目。

    ——分析思路:

    ——SQL提数:

    查询计算商品转化率,升序排列,取前100个

           

    ——Excel可视化:

           

    ——描述性分析:

    从商品看:有17款商品转化率超过了1。

    从类目看:这些商品所属类目分布均匀,除965809,4801426,2735466,2640118,5063620,4789432,2945933这7个类目之外,其他类目都只有一个商品在转化率TOP100的商品中。

    ——分析思路:

    用户价值分析常用的分析方式是RFM模型

           

    本次分析中的R,F,M具体定义(仅用于演示分析方法,无实际业务参考价值):

     

    ——SQL取数与分析:

    1)建立打分标准:先计算R,F的值,并排序,根据R,F值最大值和最小值得区间设计本次得打分标准

    -查询并计算R,F值创建视图

           

    -引用RF数值表,分别查询R,F的最大值和最小值

           

           

    -结合人工浏览的建立打分标准      

    2)给R,F按价值打分

    3)计算价值的平均值

           

    4)用平均值和用户分类规则表比较得出用户分类   

         

    ——Excel可视化      

     

    通过描述性分析得到可视化的数据后我们一般会先看一下是否符合业务常识

    如果符合常识接下来我们会通过与行业平均数据和本产品的同比环比对比看是否正常,如果不正常就要找原因,设计解决方案,如果正常那就看是否有可以优化的地方。

           

    我们首先来看一下这些描述性分析是否符合业务常识和指标是否正常:

           

    1.活跃曲线整体为上升状态,同为周六日,12月2号,3号相比11月25日,26日活跃度更高。

    2.用户在周六周日相比其他时间更活跃

    3.一天内用户活跃的最高峰期为21点

    4.从2017年11月15日致2017年12月3日,活跃用户新增38%

    5.从2017年11月15日致2017年12月3日,活跃用户次日留存增长18.67%,当日的活跃用户留存也在快速增长,第七日留存比次日留存高18.56%。

    6.用户从浏览到购买整体转化率2.3%

    7.用户从浏览到购买的路径主要有4条,路径越长转化率越低。

    8.浏览量top100的商品浏览量呈阶梯分布,越靠前的阶梯之间的落差相对越大在这个阶梯中的商品越少,越靠后商品浏览量阶梯之间的落差相对越小,同阶梯内的商品越多。

    9.浏览量TOP100的商品所属类目中,4756105,3607361,4357323三个类目浏览量远超其他类目。

    10.从商品看:有17款商品转化率超过了1。

    11.从类目看:这些商品所属类目分布均匀,除965809,4801426,2735466,2640118,5063620,4789432,2945933这7个类目之外,其他类目都只有一个商品在转化率TOP100的商品中。

    根据以上诊断分析我们梳理出了以下假设,做假设验证。

           

     

    假设1:这些商品中有高转化率的爆款商品

           

     

    对比浏览量TOP5的商品,发现这些商品转化率在同一类目下并不高,假设不成立

     

    假设2:4756105,3607361,4357323三个类目属于高频刚需类目

    -创建类目购买频次表

           

    -计算类目购买频次平均值

           

    -查询4756105,3607361,4357323三个类目的购买频次       

    4756105,3607361,4357323三个类目的用户购买频次明显高于平均值,假设成立

     

    假设3:有部分用户是未点击商详直接从收藏和购物车购买的。

           

    用户不是直接从收藏和购物车购买的,只是后续复购未点击商详,假设不成立

     

    假设4:淘宝推荐的商品主要是“同一类目下的高转化商品”

           

    用Excel对浏览量TOP100的商品ID和转化率TOP100的商品ID进行去重,结果无重复值,假设不成立


    3.结论:

    1)用户活跃:用户活跃曲线整体呈上升趋势,在一周中周六,周日活跃度比平时更高,在一天中用户活跃曲线从凌晨4点开始往上升,在中午12点和下午5~6点有两个小低谷(吃饭),到晚上9点时活跃度达到顶峰。

     

    2)用户留存:从2017年11月15日致2017年12月3日的用户留存数据来看,淘宝的用户留存数据较好,活跃用户次日留存增长18.67%,当日的活跃用户留存也在快速增长,第七日留存比次日留存高18.56%。

     

    3)用户转化:整体转化2.3%,用户从浏览到购买的路径主要有4条,路径越长转化率越低。

    4)平台推荐与用户偏好:从数据集中的数据来看,排除用户兴趣偏好标签,淘宝给用户用户推送的商品主要是高频刚需的类目,促使用户复购,流量回流平台。

     

    以上结论受数据量和数据类型的影响,并不一定准确,仅用来练习数据分析方法。

    (考虑到阅读体验文章中只放了SQL截图,如需PDF版本,再公众号后台回复“用户行为分析”领取)

    ‘伍’ 如何在EXCEL中使用SQL进行数据处理与分析

    方法一:利用Microsoft Query使用SQL语句

    ‘陆’ sql查询分析器怎么用

    查询分析器左边的对象资源管理器,右键可以创建对象(不需要写代码),查看用户对象和系统对象,可以创建脚本,可以执行任务(分离,脱机,备份,还原数据库等等)。
    而查询分析窗口可以写入SQL数据库支持的各种SQL语句,T-SQL语句,嵌入式编程语句来执行数据定义、数据操纵、数据查询、数据控制等语句,创建修改删除数据库对象(表,视图,索引,触发器)。窗口上面有分析和执行按钮,可以分析语句,执行语句。
    窗口下面还显示语句执行结果,以及系统提示等等。

    自己多摸索就好了。

    网络的数据库真迟钝,答案都采纳了,我这还能提交,坑爹…

    ‘柒’ 用SQL做简单数据分析(入门级)

    你要的分析功能已经有智能分析的要求了
    这超出了sql现有的功能 ,只用sql语句是无法直接打到这种分析的

    ‘捌’ 关于sql查询分析器的使用问题

    查询分析器是SQL Server 2000和之前版本的叫法,从SQL Server 2005开始使用的是SQL Server Management Studio。如果你仅仅安装了SQL Server 2008 Express(仅有服务器),那么是不带有SQL Server Management Studio的,可以从微软网址下载然后安装一个。

    ‘玖’ SQL 查询分析器的用法

    Microsoft® SQL Server™ 2000 SQL 查询分析器是一种图形工具,您可以使用它进行以下操作:

    创建查询和其它 SQL 脚本,并针对 SQL Server 数据库执行它们。("查询"窗口)

    由预定义脚本快速创建常用数据库对象。(模板)

    快速复制现有数据库对象。(对象浏览器脚本功能)

    在参数未知的情况下执行存储过程。(对象浏览器过程执行功能)

    调试存储过程。(T-SQL 调试程序)

    调试查询性能问题。(显示执行计划、显示服务器跟踪、显示客户统计、索引优化向导)

    在数据库内定位对象(对象搜索功能),或查看和使用对象。(对象浏览器)

    快速插入、更新或删除表中的行。("打开表"窗口)

    为常用查询创建键盘快捷方式。(自定义查询快捷方式功能)

    向"工具"菜单添加常用命令。(自定义"工具"菜单功能)