数据平台DA@IDSM

文章目录
  1. 1. 如何使用
  2. 2. 它能做些什么
  3. 3. 总体结构

DA@IDSM 是一个高效的数据存储分析平台。截止2022年4月,平台共存储了近 32 万条云盘订阅信息以及近 16 亿条云盘负载信息。平台使用 Elasticsearch 提供基本的查询服务,并结合 Django + Nginx 实现的 API 接口来提供常用的数据分析服务。

如何使用

在连接 HUST 校园网之后,打开浏览器输入下面的 url:

1
http://222.20.96.147:49083/api/subscription/diskinfo?cluster_id=20_1360900&buss_name=游戏&disk_type=data&all=true&limit=3

它将返回如下信息(敏感信息已隐藏):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
{
"data": [
{
"id": 152470,
"app_id": "125xxxxxx56",
"disk_uuid": "7eexxxxx-xxxx-xxxx-xxxx-xxxxx54703cb",
"cluster_id": "xx_xxxxx00",
"inst_id": "disk-rcxxxxob",
"vm_uuid": "071axxxx-xxxx-xxxx-xxxx-xxxxx8515eaa",
"create_date_time": "2019-04-22",
"expire_date_time": "2020-09-22",
"life_stat": "normal",
"is_local": 0,
"disk_attr": "xxxx",
"disk_type": "data",
"is_vip": 1,
"pay_mode": "prepay",
"pay_type": 0,
"vm_alias": "xxxx_TEST游戏服务器6",
"vm_cpu": 2,
"vm_mem": 4,
"app_name": "xxxx_TEST游戏服务器",
"project_name": null,
"disk_name": "未命名_2",
"disk_usage": 1024,
"disk_size": 100
},
{...},
{...}
]
}

解析:222.20.96.147 为实验室服务器网关地址, 49083 为本数据平台 API 接口的端口号。该请求返回仓库号为 20_1360900、 磁盘类型为 data、业务标签中含有 「游戏」字段的前三个云盘订阅信息。

它能做些什么

数据平台支持快速的时序数据处理,目前平台内已经支持对海量云盘负载数据的分析计算。

如果你需要经常写一些分析程序来处理数据,或者生成一些数据分析图像,那么这个平台将非常有用。同时,这些数据也使得多人共享更为方便。

总体结构

目前平台的总体结构如下图所示:

云盘订阅信息是非时序数据,放在 MySQL 中,云盘负载信息是时序数据,放在 ElasticSearch 中。常用的数据处理需求由 Django 实现。