CKAN là hệ thống quản trị dữ liệu nguồn mở chuyên dụng cho các trung tâm dữ liệu và các cổng thông tin điện tử.
CKAN cung cấp một giải pháp toàn diện cho phép dễ dàng tập hợp dữ liệu từ nhiều nguồn, quản lý dữ liệu, chia sẻ dữ liệu theo nhiều mức độ, tìm kiếm dữ liệu, trình diễn dữ liệu bằng các loại bảng biểu, đồ thị và bản đồ.
CKAN đang được nhiều chính phủ, tổ chức quốc tế, và những tập đoàn lớn sử dụng làm cổng dữ liệu mở, chẳng hạn như cổng dữ liệu của Hoa Kỳ (data.gov), Canada (canada.ca), Vương quốc Anh data.gov.uk, Energi Data Service (energidataservice.dk), The Humanitarian Data Exchange (data.humdata.org)... Cổng dữ liệu mở quốc gia của Việt Nam cũng được xây dựng trên nền tảng CKAN (open.data.gov.vn)
Tính năng nổi bật
- Quản lý publisher (organization)
- Quản lý và xuất bản dữ liệu
- Phân nhóm dữ liệu
- Theo dõi hoạt động của nhóm, tổ chức hoặc tập dữ liệu
- Trực quan hóa dữ liệu (visualization)
- Khả năng customization linh hoạt
- Plugins
- Themes
- Templates
Tech stack
CKAN được phát triển với các công nghệ backend sau:
- Python
- PostgresSQL
- Apache Solr
- Node.js
Ngoài ra, không thể thiếu HTML, CSS, JS ở tầng giao diện.
Nhóm phát triển cũng đóng gói toàn bộ giải pháp trong docker images, cho phép triển khai nhanh chóng bằng docker-compose.
Kiến trúc hệ thống:
Đánh giá
CKAN được thiết kế theo phong cách kiến trúc phần mềm hiện đại, có khả năng mở rộng và tùy biến linh hoạt.
Mã nguồn CKAN trên GitHub (ckan/ckan) có hơn 3000 stars. Cộng đồng phát triển hoạt động khá sôi nổi, hiện có gần 300 contributors, hơn 200 branches, hơn 100 releases và hàng trăm commits mỗi ngày.
Các nhà phát triển CKAN áp dụng giấy phép AGPL v3.0 (GNU Affero General Public License), hoàn toàn phù hợp dùng cho các hệ thống cổng dữ liệu mở và phi thương mại.
Về chất lượng, mã nguồn CKAN tuân thủ tốt các tiêu chuẩn phát triển phần mềm hiện nay về coding convention, automation test, auto deployment và design pattern. Đặc biệt, CKAN đang được sử dụng rộng rãi bởi nhiều tổ chức lớn, có lượng người truy cập đông đảo, cho thấy hiệu năng hệ thống rất đáng tin cậy.
Các chức năng của CKAN đã được chọn lọc cẩn thận và tổ chức một cách khoa học bởi những người có kinh nghiệm lâu năm về dữ liệu mở, đảm bảo đáp ứng những nhu cầu tổng quát nhất về một cổng dữ liệu mở.
Trải nghiệm và so sánh với Cổng dữ liệu Đà Nẵng thì thấy khoảng 70% tính năng là tương đương nhau. Khoảng 20% tính năng khác biệt do cách hiểu khái niệm, tức là có thể dùng CKAN để xử lý lại dưới góc nhìn khác. Những tính năng đặc thù của Cổng dữ liệu Đà Nẵng chủ yếu liên quan tới phần báo cáo thống kê và tích hợp với các dịch vụ Zalo, SMS.
Kết luận
Khảo sát sơ bộ cho thấy CKAN là 1 giải pháp nguồn mở hết sức tiềm năng trong việc xây dựng trung tâm dữ liệu, cổng thông tin cho các tỉnh thành. Nếu có thể đào sâu nghiên cứu, làm chủ bộ giải pháp này, các doanh nghiệp phần mềm sẽ có lợi thế không nhỏ trong việc tham gia các dự án chuyển đổi số.