将带有格式的文本保存到数据库中的方法/步骤:
1、在jsp中,页面的带有格式的文本内容外面用一个大的标签,给定表签名。
2、页面做提交的时候用上面的表签名点innerHTML的方式来获取页面带有标签和样式的内容。
3、将上面取得的内容作为一个字符串保存到数据库即可,下次把数据库里的内容直接输出到页面就可以了。
对于要输出到word里保存样式的方法也是类似的,只是需要去看一下word解析文本的方式与jsp有何区别,在输出到word的时候做一下变换即可。
❷ 什么是文本数据库与关系数据库之间有什么联系和区别
数据库,是经过优化的存储格式,一定比文本文件效率好,因为结构化处理的关系,可以很好地应对如搜索、匹配等操作;
而文本,表面看起来简单,但是,随着量的增加,一旦达到某个量级,几乎就不可用了。
至于CPU,数据库比文本文件的方案更加可控,更安全。
❸ 大规模文本检索应当用什么数据库
是的,大规律检索是不能通过数据库的。
检索的时候不能通过数据库的查询来完成。
这个东西涉及到搜索引擎的相关技术。
你可以写一个小程序试试,假设每篇文章 2000个汉字,有500万篇,都存入数据库,你检索一下试试?
这涉及到分词技术,分词索引,分词的反向索引..
这些技术通常都是保密的。要不然google,网络它们也不会这么有实力,就因为掌握到了这些技术。
之所以这么麻烦,都因为中文语法的特殊性...
❹ 如何建立文本数据库
这个如果要自己管理数据的话还是挺有难度的。
不过借用数据库也许可以折中一下,把每个文档的数据放到数据库的一个字段中,然后用like '%...%'匹配。(下策^_^)
推荐使用桌面搜索
❺ 文本文件导入到数据库中的几种方法
大型的数据库开发中常常遇到数据源是平面文件(如文本文件)的情况,对于这样的数据源,无法使用数据库对其数据进行有效的管理,另外也无法使用sql语句对其进行查询和操作,所以当务之急就是将这些平面文件导
入到数据库中,然后就可以对其进行高效的操作了。
下面介绍几种常见的数据导入的方法,希望能够给大家启迪。另外,本文所涉及到的数据库均为ORACLE数据库,其实对于其他数据库而言,方法类似。
一、Sql*:Loader
该方法是Oracle数据库下数据导入的最重要的方法之一,该工具由Oracle客户端提供,
其基本工作原理是:首先要针对数据源文件制作一个控制文件,控制文件是用来解释如何对源文件进行解析,其中需要包含源文件的数据格式、目标数据库的字段等信息,一个典型的控制文件为如下形式:
LOAD DATA
INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410.txt'
TRUNCATE (也可以用append替换TRUNCATE)
INTO TABLE fj_ipa_agentdetail
fields terminated ","
trailing nullcols
( AGENT_NO char,
AGENT_NAME char,
AGENT_ADDRESS char,
AGENT_LINKNUM char,
AGENT_LINKMAN char
)
其中,INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410.txt'指明所要导入的源文件,其实源文件也可以直接通过命令行来输入获得 ,fj_ipa_agentdetail为目标表的名字,fields terminated ","是指源文件的各个字段是以逗号分隔,trailing nullcols表示遇到空字段依然写入到数据库表中,最后这5个字段是目标数据库表的字段结构。通过上面这个典型的控制文件的格式分析可知,控制文件需要与源文件的格式信息一致,否则导入数据会出现异常。
除了控制以外,sql*loader的还需要数据文件,即源文件。根据格式的不同,源文件可以分为固定字段长度和有分隔符这两大类,这里将分别说明这两种情况:
固定字段长度的文本文件
就是每个字段拥有固定的字段长度,比如:
602530005922 1012
602538023138 1012
602536920355 1012
602531777166 1012
602533626494 1012
602535700601 1012
有分隔符的文本文件
就是每个字段都有相同的分隔符分隔,比如:
1001,上海长途电信综合开发公司,南京东路34号140室
1002,上海桦奇通讯科技有限公司,武宁路19号1902室
1003,上海邦正科技发展有限公司,南京东路61号903室
对于上述两种文件格式sql*loader均可以做处理,下面就前面那个固定长度的文本来举例说明:
由于该文本只有两个字段,一个为设备号,一个是区局编号,两者的长度分别为20和5,那么可以编制控制文件如下:
LOAD DATA
INFILE '/ora9i/fengjie/agent/data/ipaagent200410.txt'
TRUNCATE
INTO TABLE fj_ipa_agent
( DEVNO POSITION(1:20) CHAR,
BRANCH_NO POSITION(21:25) CHAR
)
其中,'/ora9i/fengjie/agent/data/ipaagent200410.txt'为该文件的完全路径,POSITION(M:N)表示该字段是从位置M到位置N。
对于有分隔符的数据文件,前面已经有一个例子,这里就不再赘述了。总之,使用Sql*Loader能够轻松将数据文件导入到数据库中,这种方法也是最常用的方法。
二、 使用专业的数据抽取工具
目前在数据仓库领域中,数据抽取与装载(ETL)是一重要的技术,这一技术对于一些大的数据文件或者文件数量较多尤其适合。这里简单介绍目前一款主流的数据抽取工具 ――Informatica。
该工具主要采用图形界面进行编程,其主要工作流程是:首先将源数据文件的结构(格式)导入为Informatica里,然后根据业务规则对该结构进行一定的转换(transformation),最终导入到目标表中。
以上过程仅仅只是做了一个从源到目标的映射,数据的实际抽取与装载需要在工作流(workflow)里进行。
使用专业的数据抽取工具,可以结合业务逻辑对多个源数据进行join,union,insect等操作,适合于大型数据库和数据仓库。
三、 使用Access工具导入
可以直接在Access里选择‘打开‘文本文件,这样按照向导来导入一个文本文件到Access数据库中,然后使用编程的方法将其导入到最终的目标数据 库中。
这种方法虽然烦琐,但是其对系统的软件配置要求相对较低,所以也是有一定的使用范围
❻ 可以写一个文本文档作为数据库吗怎么写这样的数据库
文本无法作为数据库.如果只是想作为数据的载体,还是可以的.
❼ 如何将文本文件中的数据写入数据库中
你先将文本文件按换行符的分开读到一个字符窜变量中去,name:=(str1,0,4),加到数据库中去呀。
比如:str1:='张某;19;一(1)',然后就分化这个字符窜,将他逐个加到数据库中去呀
❽ 文本数据库是什么
文本数据库是包含对象文字描述的数据库。通常,这种词描述不是简单的关键词,而是长句子或短文,如产品介绍、错误或故障报告、警告信息、汇总报告、笔记或其他文档。通常,具有很好结构的文本数据库可以使用关系数据库系统实现。
❾ 怎样将文本文件变成数据库文件
文本文件是非格式化文件
数据库文件,例如mdb文件,是标准格式化文件
没有办法直接转换
你可以自己写代码解析文本,写入数据库
❿ 谁帮忙解释一下“文本数据库”
ctb论坛就采用了
php+txt架构
一、CTB的历史
ctb是16hot在01年底牵头,由我和winnet参与,将整个结构搭建了起来。结构是16和winnet设计,02年底我实现了大部分功能,后来Felixsun和ccxx加入,并由ccxx实现了更多的功能。在03年初的时候,整个论坛是比较成型了。
具体来说,ctb应该在04年初基本停顿了,一直没有什么新的比较大的改动。
从03年以来我就没有负责过,都是以jivi为首的爱好者在维护吧。
我也有3年左右没有来过这里了,也对不住ctb的忠实的用户和爱好者。在此向大家道歉了!真诚的道歉,因为虽然很少来这里,但还是觉得这里是自己的家。
二、说一下我吧
写ctb基本都是在上大学的时候,03年毕业后,可以说对ctb没有进行过改动和维护。首先是工作比较忙,没有了更多的业余时间;其次是写ctb的文本代码编写,就象旅行说的一样,太让人抓狂了,不象sql程序那样,不象桌面程序那样行云流水。
毕业后,和16商量过,计划开发mysql的论坛,也由于种种原因没有实施计划。可能是比较懒的缘故吧。自从php5出来后,我对sqlite是比较看好的,认为sqlite的出现基本结束了php的文本程序的历史。也写了一段sqlite的php论坛,而且基本功能也成型了,但由于国内sqlite的空间没有成规模和自己比较懒的缘故吧,这个论坛一直没有对外发布过。
过年的时候,和雪人计划合作开发c#的论坛,已经编写了雏形代码,后来由于他去了discuz工作,而搁浅。我想不久,discuz在雪人的努力下应该发布discuz的c#版本吧。
原来都是凭着兴趣,和激情在写程序,没有考虑过任何商业运做。把写代码当成一种享受,就象在网吧玩游戏的孩子对游戏的乐趣一样。没有过多考虑过商业化的东西。如果开始我和16就比较考虑商业化的东西,ctb也应该成为国内最大、最着名的论坛了,呵呵。
现在主要从事工作是c++底层代码的编写,以及php业务系统的设计,还有就是c#桌面程序的实现。其他的工作中就用不到了,有兴趣的朋友可以来wangyzh@dns.com.cn联系我。
三、一些将来的设想
开始的时候是凭激情,平兴趣去写代码,ctb也可以算国内代码质量比较好的程序了,但后来随着接触各种程序的加多,发现自己存在各种不足,无论是结构设计还是具体代码优化。不敢说,国内大部分论坛程序的代码都很差吧,但至少从结构设计上,基本是没有比较漂亮的。不要提效率如何如何好,呵呵,现在的服务器,运行各种论坛程序基本效率是差不多的,除非你的程序写的极差,有各种安全漏洞。越到后来自己越想把代码结构和具体编写完美实现,但越来越发现自己的不足,需要学习,需要改进,所以一直没有彻底的开始和去完成,所以时间也拖到了现在。
从来没有停止过一种想法,那就是彻底的升级ctb或从新编写ctb,无论是sqlite或mysql数据库。还是其他的,但一直由于各种原因而没有从新彻底的开始。
今天先说这么多吧,在不久的将来,大家会看到我们的新产品的。。。