===== 确定主题 ===== * 该数据仓库要解决的问题 ===== 建模 ===== * 高层建模(E-R图) * 中间层建模(数据项集) * 底层建模(物理模型) ===== 模型转化为数据仓库数据模型 ===== 注意如下问题: * 数据粒度(一般有高粒度,低粒度等多重粒度) * 数据分区(一般按时间,地区分区,便于管理 ===== ETL ===== * 从各个系统导入数据 * 转换格式,保证字段、单位、编码统一 * 清洗数据(保证数据有效) * 导入时考虑增量导入问题