Airflow in the nut shell:
- Một phiên bảo cron tab (chạy mỗi ngày, mỗi tuần, mỗi giờ mỗi tháng) với UI xịn xò.
- Các tín đồ data hay sử dụng để viết ETL (Extract Transform Load) job
- Ví dụ như là select vào rows từ MySQL
- Thêm ít gia vị (Cooking)
- Load vào Datawarehouse
1 phút quảng cáo
- Bạn đang mong muốn tìm kiếm cơ hội mới
- Bạn muốn làm việc với những công nghệ big data tối tân nhất.
- Xài serveless tốn kém quá với chậm chạp, bạn có thể tự build & publish cho hơn 500 anh em TIKI xài.
Mới vào nghề#
Team Data Platform của Tiki sử dụng Apache Airflow từ những ngày đầu lập team từ năm 2017. Cho tới hôm nay kiến trúc & cách sử dụng airflow cũng thay đổi khá đáng kể. Bài viết này sẽ chia sẽ cách mà Team Data của dụng airflow, ưu nhược điểm của các cách dùng.