❶ EXCEL从数据库提取数据
1、打开源数据文件,把首行中的对应的数据,复制行到空白位置。
❷ 如何用r语言抓取数据库中的数据库
一、 安装RODBC库
1、进入R语言的GUI界面(RGUI.EXE),在菜单栏选择“程序包/安装程序包
2、在弹出的窗口里往下拉,选择RODBC如图,点击确定
3、在ODBC数据源管理器里将需要的数据库添加进去,这里笔者使用的是sql Server2008,驱动程序选择Native Client10.0
3、在R语言窗口输入连接语句
> library(RODBC)
**这里是载入RODBC库
> channel<-odbcConnect("MyTest",uid="ripley",case="tolower")
**连接刚才添加进数据源的“MyTest”数据库
**ch <- odbcConnect("some dsn ", uid = "user ", pwd = "**** ")
**表示用户名为user,密码是****,如果没有设置,可以直接忽略
> data(USArrests)
**将“USArrests”表写进数据库里(这个表是R自带的)
> sqlSave(channel,USArrests,rownames = "state",addPK = TRUE)
**将数据流保存,这时候打开SQL Server就可以看到新建的USArrests表了
> rm(USArrests)
> sqlTables(channel)
**给出数据库中的表
> sqlFetch(channel,"USArrests",rownames = "state")
**输出USArrests表中的内容
> sqlQuery(channel,"select * from USArrests")
**调用SELECT查询语句并返回结果(如图)
> sqlDrop(channel,"USArrests")
**删除表
> odbcClose(channel)
**最后要记得关闭连接
当然,通过这个办法也可以读取Excel、Access表中的内容,具体方法类似,这里不再重复
❸ 拉取别人数据库的数据非法吗
有些违法,有些合法。
如果爬取对象是提供公开查询服务的网站,如中国政府网、最高人民法院裁判文书网等,是可以抓取的。
公开指的是对大众公开,对所有人公开的信息,并不是特定人群才能看到的信息。
如果爬取对象是各类商业服务网站,这类网站没有设置反爬声明,也没有采取反爬技术措施的,则也是可以爬取的。
❹ 网络爬虫抓取数据 有什么好的应用
网络爬虫可以根据你的不同需求,选择爬取对象、爬取字段进行爬取(必须是公开数据),好的应用比如:
电商客户,我们采集的数据信息主要为商品信息数据、商品评论信息数据、区域库存价格数据、电商舆情数据等。
金融行业客户,采集主要的信息为公开的客户信息、投融资信息、金融舆情信息、市场数据、公开的财务报表、股票、基金、利率等信息。
在网路舆情方面,采集主要信息为综合论坛、新闻门户、知识问答、自媒体网站、社交平台等网络媒体上的相关舆情信息。