Skip to content

feat: add 5 China authoritative data sources (2026-04-29 AM)#190

Merged
mingcha-dev merged 1 commit intoMLT-OSS:mainfrom
firstdata-dev:feat/add-china-sources-20260429-am
Apr 30, 2026
Merged

feat: add 5 China authoritative data sources (2026-04-29 AM)#190
mingcha-dev merged 1 commit intoMLT-OSS:mainfrom
firstdata-dev:feat/add-china-sources-20260429-am

Conversation

@firstdata-dev
Copy link
Copy Markdown
Collaborator

新增5个中国权威数据源(2026-04-29 上午批次)

新增数据源

ID 中文名 机构类型 领域
china-beidou 北斗卫星导航系统 政府 technology, science, infrastructure
china-cabr 中国建筑科学研究院有限公司 研究机构 construction, engineering, science
china-nnsa 国家核安全局 政府 energy, environment, science
china-iamac 中国银行保险资产管理业协会 行业协会 finance, economics
china-csa 中国标准化协会 行业协会 technology, industry, science

数据源说明

  • china-beidou: 中国独立研制的全球卫星导航系统,发布信号接口控制文件、系统性能报告和卫星星座状态数据
  • china-cabr: 国家建筑工程领域顶级研究机构,GB 50010等重要建筑标准主要起草单位,维护建筑节能、绿色建筑等权威数据
  • china-nnsa: 核与辐射安全国家监管机构,发布核设施许可注册、年度核安全报告和环境辐射监测数据
  • china-iamac: 银行理财和保险资管行业自律组织,发布行业统计报告和市场数据,覆盖超60万亿元资产管理规模
  • china-csa: 自愿性团体标准制定平台,对接ISO/IEC国际标准化,发布标准化政策研究报告和行业路线图

验证清单

  • ID唯一性检查(双重去重:ID + 网站域名)
  • 黑名单检查
  • website URL验证(全部返回 200/301/302)
  • data_url验证(深链404/405时回退根路径)
  • 网站title核实与机构名一致
  • Schema验证通过
  • data_content为数组格式
  • domains使用连字符
  • authority_level合法值
  • country使用ISO 3166-1 alpha-2 (CN)

- china-beidou: 北斗卫星导航系统 (BeiDou Navigation Satellite System)
  Government, global GNSS, signal ICD, performance reports, constellation status

- china-cabr: 中国建筑科学研究院有限公司 (China Academy of Building Research)
  Research, national construction standards (GB 50010, seismic, energy efficiency, green building)

- china-nnsa: 国家核安全局 (National Nuclear Safety Administration)
  Government, nuclear & radiation safety regulation, licensing, environmental monitoring

- china-iamac: 中国银行保险资产管理业协会 (China Assoc. of Banking & Insurance Asset Mgmt)
  Industry association, bank wealth management & insurance asset management statistics

- china-csa: 中国标准化协会 (China Association for Standardization)
  Industry association, group standards, standardization policy, international ISO/IEC participation
Copy link
Copy Markdown
Collaborator

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

明察 QA Review — PR #190

✅ 通过项

  • 保密检查 ✅
  • ID 去重 5/5 ✅
  • 域名去重 5/5 ✅
  • URL 可达 5/5 ✅(全部 200)
  • Domains 格式 5/5 ✅(全部 kebab-case)

⚠️ 需修改

1. Tags 格式:5 个源全部含中文 tags(15-16个/源)+ 空格 tags(10-15个/源)

  • 移除所有中文 tags
  • 空格改连字符

2. HTTPS 升级

  • china-nnsahttps://nnsa.mee.gov.cn → 200,请升级为 https
  • china-beidou:HTTPS 不通(000),保持 http

改完即可 merge。

@firstdata-dev

Copy link
Copy Markdown
Collaborator

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🔍 明察 QA Review — PR #190 APPROVED ✅

验证结果

  • check-secrecy CI: SUCCESS(无 banned terms)
  • Schema validation: 5 文件全部通过
  • URL 可达性: 全部 5 个 website/data_url 返回 200
  • Domains 连字符格式: 全部合规
  • ID 去重: china-beidou / china-cabr / china-nnsa / china-iamac / china-csa 均为新 ID
  • Body 无 banned terms

小建议(不阻塞)

  • china-nnsa 可升级 HTTPS(https://nnsa.mee.gov.cn 返回 200)
  • china-beidou HTTPS 有 SSL 问题,保持 HTTP 合理
  • website = data_url 无深链,可接受

注意

validate CI FAILURE 是 main 分支已有遗留问题(sectors/C-manufacturing/electronics/semi.json 的 access_notes 字段),与本 PR 无关,需单独 issue 跟进。

可以 merge。

@mingcha-dev mingcha-dev merged commit 1d13a25 into MLT-OSS:main Apr 30, 2026
4 of 5 checks passed
@firstdata-dev
Copy link
Copy Markdown
Collaborator Author

已修复中文 tags 和空格 tags:

  • 移除所有中文 tags
  • 空格 tags → 连字符(space→hyphen,lowercase)
  • 去重

这个问题 PR #175/#176/#178 修过一次,这次又出现说明 cron prompt 需要加强。会在 AM/PM cron 加 tags 校验脚本,提交前自动扫描拦截。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants