A. 空间数据库的组成部分
空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。《空间数据库》范围及重点 1. 第一章:绪论 1) 空间数据库基本概念、组成部分、名称简写之间的联系与区别与联系; 答;利用当代的系统方法,在地理学、地图学原理的指导下,对地理空间进行科学的认识与抽象,将地理数据库化为计算机处理时所需的形式与结构,形成综合性的信息系统技术——空间数据库 或者SDBMS是海量SD的存储场所、提供SD处理与更新、交换与共享,实现空间分析与决策的综合系统。 组成:存储系统、管理系统、应用系统 是SDBS的简称 2) 目前空间数据库实现方案; 答:ORDBMS 3) GIS,RS与空间数据库之间的联系; 4) 常见的空间数据库产品 答:轻量级: MS的Access、FoxPro、 SUN的Mysql 中等:MS的SQL Server系列 重量级:Oracle的Oracle 不太熟悉的有: Sybase、Informix、DB2 、Ingress、 PostgreSQL(PG)等 5) 产生空间数据库的原因; 答:直接利用? SD特征 :空间特性 非结构化特征 空间关系特征 多尺度与多态性 海量数据特性 存在的问题:复杂图形功能:空间对象 复杂的空间关系 数据变长记录 6)空间数据库与普通关系数据库的主要区别。 答:关系数据库管理属性数据,空间数据采用文件库或图库形式;增加大二进制数据类型(BLOB),解决变长数据存储问题;将空间数据/属性数据全部存放在数据库中;但空间特性由程序处理 2. 第二章:空间数据库模型 1) 如何理解空间数据库模型; 2) 空间数据及空间关系; „ (1) 空间数据类型 几何图形数据 影像数据 属性数据 地形数据 元数据:对空间数据进行推理、分析和总结得到的关于数据的数据, 数据来源、数据权属、数据产生的时间 数据精度、数据分辨率、元数据比例尺 地理空间参考基准、数据转换方法… (2) 空间关系 指地理空间实体之间相互作用的关系: 拓扑关系:形状、大小随投影改变。在拓扑变换下不变的拓扑变量,如相邻、包含、相交等,
反映空间连续变化的不变性 方位关系:地理空间上的排列顺序,如前后、上下、左右和东、南、西、北等方位 度量关系:距离远近等 3) 空间数据库如何建模; DB设计三步骤 ‹ Conceptual Data Model:与应用有关的可用信息组织、数据类型、联系及约束、不考虑细节、E-R模型 Logic Data Model 层次、网状、关系,都归为关系,SQL的关系代数(relational algebra, RA) Physical Data Model:解决应用在计算机中具体实现的各种细节,计算机存储、数据结构等 4) 模型之间如何转换? 5) 可行的空间数据库建模方案。 面向对象的空间数据库模型GeoDatabase 3. 第三章:空间数据库存储与索引 1) 空间数据如何组织、存储的,采用什么技术或者方法; 为有效表达空间信息内容,空间数据必须按照一定的方式进行组织与存储:适合外存操作的数据结构、记录和文件的多种组织方式 SDB空间数据组织:数据项、记录、文件、数据库 SDB空间数据存储:二级存储器、缓冲区管理器、空间聚类(clustering)、空间索引 2) 空间近似与空间聚类; 目的:降低响应大查询的寻道时间和等待时间,在二级存储中空间上相邻的/查询上有关联的空间对象在物理上存放在一起, 内部聚类(internal clustering):加快单个对象的访问,一个对象都存放在一个磁盘块(页面);如超出则存放在连续扇区,本地聚类(local clustering):加快多个对象访问。一组空间相邻对象存放在一个页面 空间聚类比传统聚类技术复杂。多维空间对象无天然的顺序 磁盘:一维存取,高维:将高维映射到一维, 一一对应,保持距离(distance preserving):一一对应,容易;距离不变,近似,映射技术、Z序(z-order)、Hilbert曲线 3) 空间数据库性能提升的关键问题是什么?如何提升; 数据库索引,基于树:ISAM、B树、B 树等,基于Hash:静态、可扩展、线性等 4) 空间索引技术是什么?为什么产生?有哪些常见的空间索引;各有何特点及适用范围? 依据空间对象的位置和形状或者空间对象之间的空间关系,按一定顺序排列的一种数据结构,介于空间操作算法和空间对象之间,通过筛选,大量与特定空间操作无关的空间对象被排除,提高效率,空间数据库关键的技术 空间索引产生的原因:空间数据的特点:空间定位、空间关系、多维、多尺度、海量、复杂,传统数据库索引处理的一维的字符、数字,对多维处理采用组合字段 1、基于二叉树的索引技术:二分索引树结构主要用于索引多维数据点;对复杂空间目标(线、面、体等)的索引却必须采用近似索引方法和空间映射技术 2、 基于B树的索引技术 ‹B树的变体如R树系列,外包矩形;对大型数据库具有出色表现;需要解决:减少区域重叠,提高搜索效率 3、基于哈希的网格技术
B. Superset1.0在Windows下怎么安装
BI数据可视化——Windows环境下Superset1.0版本安装配置方法
一.准备环境
安装Python,建议安装Python3.7.4,兼容性更好。
二.创建虚拟环境
1.命令:pip install virtualenv
2.命令窗口cd至superset存放路径下,使用命令:virtualenv envs,执行命令后系统创建一个envs名称的文件夹。
三.激活虚拟环境
命令:envsscriptsactivate
四.安装Superset1.0
1.setuptools和pip更新
命令:pip install --upgrade setuptools pip
2.安装python_geohash组件
命令:pip install python_geohash-0.8.5-cp37-cp37m-win_amd64.whl
下载地址:https://www.lfd.uci.e/~gohlke/pythonlibs/
说明:该组件需要自行到官网下载并匹配Python版本,然后存放于当前命令窗口的文件路径下。独立安装该组件是为了避免自动安装出错。
3.安装Supetset 1.0
命令:pip install apache-superset
4.连接Mysql配置(该步骤是了为连接Mysql数据库提前做准备,无连接Mysql需求的可以省略)
命令:pip install mysqlclient -i https://pypi.tuna.tsinghua.e.cn/simple/
pip install pymssql -i https://pypi.tuna.tsinghua.e.cn/simple/
pip install pillow -i https://pypi.tuna.tsinghua.e.cn/simple/
5.修改superset目录下config.py值
用写字板打开superset目录下config.py文件:
1.查找到BABEL_DEFAULT_LOCALE = "en",把en更改为zh,默认语言变为中文。
2.查找到CACHE_CONFIG: CacheConfig = {"CACHE_TYPE": "null"}
DATA_CACHE_CONFIG: CacheConfig = {"CACHE_TYPE": "null"}
把null更改为simple,该步骤是为了避免Flask_Caching报错。
6.初始化数据库
命令:superset db upgrade
7.为flask框架配置app名称
命令:set FLASK_APP=superset
8.创建管理员用户
命令:flask fab create-admin
9.加载系统系统自带案例
命令:superset load_examples
说明:在superset1.0.1下,案例加载一般会出错,笔者试了好多方法也没能解决,不过这些案例仅供参考,实际对superset的使用与开发不影响。
10.Superset初始化
命令: superset init
11.启动superset
命令:superset run -p 8088 -h 127.0.0.1 --with-threads --reload --debugger
C. hash查找算法 数据量在10万左右 数据库中存储
可以用,但是最好加入缓存机制。
D. 什么是笛卡尔积笛卡尔积是什么意思
笛卡尔乘积是指在数学中,两个集合X和Y的笛卡尓积(Cartesian proct),又称直积,表示为X×Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员 。
假设集合A={a, b},集合B={0, 1, 2},则两个集合的笛卡尔积为{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}。
类似的例子有,如果A表示某学校学生的集合,B表示该学校所有课程的集合,则A与B的笛卡尔积表示所有可能的选课情况。A表示所有声母的集合,B表示所有韵母的集合,那么A和B的笛卡尔积就为所有可能的汉字全拼。
设A,B为集合,用A中元素为第一元素,B中元素为第二元素构成有序对,所有这样的有序对组成的集合叫做A与B的笛卡尔积,记作AxB.
笛卡尔积的符号化为:
A×B={(x,y)|x∈A∧y∈B}
例如,A={a,b}, B={0,1,2},则
A×B={(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}
B×A={(0, a), (0, b), (1, a), (1, b), (2, a), (2, b)}
(4)geohash数据库扩展阅读
给出三个域:
D1=SUPERVISOR = { 张清玫,刘逸 }
D2=SPECIALITY= {计算机专业,信息专业}
D3=POSTGRADUATE = {李勇,刘晨,王敏}
则D1,D2,D3的笛卡尔积为D:
D=D1×D2×D3 ={(张清玫, 计算机专业, 李勇), (张清玫, 计算机专业, 刘晨),
(张清玫, 计算机专业, 王敏), (张清玫, 信息专业, 李勇),
(张清玫, 信息专业, 刘晨), (张清玫, 信息专业, 王敏),
(刘逸, 计算机专业, 李勇), (刘逸, 计算机专业, 刘晨),
(刘逸, 计算机专业, 王敏), (刘逸, 信息专业, 李勇),
(刘逸, 信息专业, 刘晨), (刘逸, 信息专业, 王敏)}
这样就把D1,D2,D3这三个集合中的每个元素加以对应组合,形成庞大的集合群。
本个例子中的D中就会有2X2X3个元素,如果一个集合有1000个元素,有这样3个集合,他们的笛卡尔积所组成的新集合会达到十亿个元素。假若某个集合是无限集,那么新的集合就将是有无限个元素
E. centos7怎么编译安装mysql5.7
更好的性能
对于多核CPU、固态硬盘、锁有着更好的优化,每秒100W QPS已不再是MySQL的追求,下个版本能否上200W QPS才是用户更关心的。
更好的InnoDB存储引擎
更为健壮的复制功能
复制带来了数据完全不丢失的方案,传统金融客户也可以选择使用。MySQL数据库。此外,GTID在线平滑升级也变得可能。
更好的优化器
优化器代码重构的意义将在这个版本及以后的版本中带来巨大的改进,Oracle官方正在解决MySQL之前最大的难题。
原生JSON类型的支持
更好的地理信息服务支持
InnoDB原生支持地理位置类型,支持GeoJSON,GeoHash特性
新增sys库