Download - Distributed Transaction in Microservice
Distributed Transaction in Microservice
Lê Minh NghĩaSolution Architect at Tiki.Vn
Contents1. Distributed Transaction Problem.
2. CAP Theorem
3. Replicate Model
4. Consistency and Eventually Consistency
5. Implementation
6. Case Study
Phần 1. Các kiến thức căn bản
Distributed Transaction Problem
• Là vấn đề đòi hỏi đảm bảo tính nhất quán của dữ liệu trên môi trường phân tán
• Có sự tham gia nhiều hơn một data source vào một quá trình xử lý
Data Sources
Database
Service
Write
Caching Message Queue
External Service
Các data source đa dạngPhải đảm bảo dữ liệu giữa các nguồn nhất quán
TransactionTransaction phải đảm bảo tính ACID:• Atomic: phải đảm bảo thực thi tất cả hoặc
không gì• Consistency: đảm bảo nhất quán dữ liệu• Isolation: đảm bảo vấn đề tranh chấp• Duration: dữ liệu phải được lưu trữ ổn định
Disitributed Transaction in Microservice
• Hệ thống chia nhỏ thành các Microservice rất nhỏ
• Phải đảm bảo dữ liệu tất cả các service phải nhất quán
• Các service hầu hết là các restful service• Microservice là một hệ thống phân tán mức
độ cao• Về cơ bản: không có Transaction trong kiến
trúc Microservice!
CAP Theorem• Consistency• Avalaibility• Partition Tolerant
Một hệ thống phân tán chỉ có thể đạt được 2 trên ba tính chất trên
CAP Theorem• Consistency: Đảm bảo dữ liệu giữa các
node là nhất quán• Availabiilty: đảm bảo tính available của hệ
thống khi một số node không available• Partition Tolerance: đảm bảo khả năng
hoạt động khi mạng giữa các node không ổn định
CAP Theorem in Microservice
Nói chung Microservice chỉ có thể đảm bảo hai tính chất:• Avaialability• Partition Tolerance
Microservice không đảm bảo consistency giữa các node trên toàn bộ hệ thống!
Consistency vs Eventually Consistency
• Consistency: đảm bảo tính nhất quán của dữ liệu. Tại mọi thời điểm trên hệ thống dữ liệu phải nhìn nhất quán giữa tất cả các node.
• Eventually Consistency: đảm bảo dữ liệu giữa các hệ thống sẽ nhất quán sau một khoảng thời gian nhất định.
• Microservice chỉ có thể đảm bảo dữ liệu là Eventually Consistency
Microservice
• Đánh đổi Consistency bằng tính chất Avalaibility và Partition Tolerance
• Không consistency nhưng phải đảm bảo là eventually consistency giữa các service
Phần 2:Giải pháp
Replicate Model
• Primary Data Backup• State Machine Model
(Active Active Model)
Replicate Model• VD: để thay đổi dữ liệu tồn kho khi mua
bán và xuất nhập. Ban đầu có 10. Bán đi 2, nhập vào 5, bán đi 7. Cần replicate dữ liệu đi các nguồn:
• Primary Backup: 8, 13, 6• State Machine: -2, + 5, -7
Replicate Model
• Luôn đảm bảo ghi log các quá trình thay đổi
• Gửi các thay đổi đúng thứ tự và ổn định
Problems in Microservice
Database
Service
Write
Caching Message Queue
External Service
Không có bất cứ cách nào đảm bảo việc ghi dữ
liệu đồng thời nhiều nguồn dữ liệu thoả mãn
tính chất của một transaction
Problems in Microservice
• Các kịch bản lỗi:• Ghi dữ liệu nhưng không gọi được service
khác• Gọi được serivce khác nhưng không ghi
được dữ liệu
Solutions• Đảm bảo chỉ thay đổi dữ liệu bắt đầu ở một
nguồn. Không đồng thời thay đổi dữ liệu của tất cả các nguồn.
• Tiến hành replicate các thay đổi một cách ổn định tới các nguồn đích
• Triển khai hệ thống log để đảm bảo quá trình replicate là ổn định.
• Mục tiêu: đảm bảo dữ liệu giữa các hệ thống là Eventually Consistency
Phần 3: Implementations
1. Log• Log là phương thức chính và quan trọng
nhất để giải quyết vấn đề replicate dữ liệu trong hệ thống phân tán
• Xây dựng cấu trúc log, lưu trữ các thay đổi muốn gửi đi và gửi bất đồng bộ tới nguồn đích
• Đảm bảo transation giữa business data và log data
• Xoá bỏ log sau khi gửi đi
1. Log
Service
Business Data
Log Data
Đảm bảo transactio
n
BackGround Worker
Other Service
Caching
Message Queue
Other Data Sources
2. Event Sourcing Pattern
Lưu trữ các thay đổi dưới dạng log event
Gửi các event tới các nguồn đích
3. Saga Pattern
Xây dựng cơ chế log để theo dõi các bước thực thiThực hiện roll back khi các bước bị lỗi
4. CDC Capture Data Change
• Bắt trực tiếp các thay đổi Database để replicate thay đổi tới các data source khác nhau. VD:
• MySQL: decode file binlog• Mongo: sử dụng cơ chế oplog
5. Message Queue
5. Message Queue• Sử dụng message queue là nền tảng tích
hợp bất đồng bộ chính cho toàn bộ các service
• Loại bỏ việc gọi api chéo giữa các service• Tăng khả năng availability của hệ thống• Giảm thiểu chi phí maitain khi chỉ cần đảm
bảo message queue available. Các Service không cần available tại cùng một thời điểm
6. Integration Model
6. Integration ModelLog:
• Đảm bảo các dữ liệu cần gửi đi được lưu trữ ổn định. Đảm bảo business data và log data luôn được lưu trữ ổn định.
Background Worker:
• Đảm bảo quá trình gửi dữ liệu từ log tới message queue ổn định: chắc chắn gửi được và gửi đúng thứ tự.
Message Queue:
• Đảm bảo gửi message tới các nguồn dữ liệu đích• Đảm bảo các message được delivery đúng thứ tự gửi vào• Đảm bảo các message được persistent không bị mất• Kafka và Windows Service Bus là các giải pháp tốt nhất
Các Data Source khác:
• Trực tiếp nhận message từ queue• Chú ý việc chống trùng lặp message (Idempotemcy filtering)
7. Consistency Requirements
• Trong ba yếu tố CAP, liệu AP có thể thoả mãn mọi trường hợp?
• Trong trường hợp bắt buộc đòi hỏi Consistency cần phải đánh giá lại mô hình:
1. Liệu việc chia service đã hợp lý hay chưa? Thông thường sẽ không chia nếu dữ liệu bắt buộc phải strong consistency.
2. Có thể điều chỉnh nghiệp vụ được không? Có trade off được giữa đòi hỏi tính nhất quán và khả năng mở rộng không?
3. Có thể triển khai SOAP để handle distributed transaction không?
4. Có thể cài đặt two phase commit để handle distributed transaction không?
Phần 4 Một số case study
1. Đặt hàng• Kịch bản: có hai serivce, catalog service
quản lý dữ liệu sản phẩm, order service quản lý đơn hàng. Khi đặt hàng thì trừ đi một lượng sản phẩm nhất định rồi tạo đơn hàng.
• Risk: có thể trừ số lượng sản phẩm mà không tạo được đơn hàng
Solution
Order Service
Catalog Service
1. Gửi request giữ tồn (Sync)
Database
2. Place Order
Message Queue
3. Gửi một lệnh trừ tồn
4. Nếu không nhận được lệnh trừ tồn thì sau một khoảng thời gian nhất định thì rollback lại số lượng tồn.
2. Bài toán trừ tiền
• Kịch bản: có hai service là order service và payment service. Payment service chứa thông tin tiền ảo của người dùng. Tiền ảo trừ được thì đơn hàng được đặt.
• Risk: tiền trừ mà đơn hàng không đặt được
Solutions
Order Service Catalog
Service
1. Gửi request giữ tiền (Sync)
Database
2. Place Order Request Queue
3. Gửi một lệnh trừ tiền
5. Nếu không nhận được lệnh trừ tiền thì sau một khoảng thời gian nhất định thì rollback lại tiền cho người dùng
Response Queue 4. Gửi response
3. Bài toán tính tiền gói hàng
• Kịch bản: giả sử một khách hàng mua 2 sản phẩm trị giá 200k, mỗi món 100k. Đã trả trước 150k, hàng được chia làm hai gói, giao hai lần. Cần thu khách hàng thêm 50k.
• Lần 1 đi giao món thứ nhất, không phải thu gì. Đã trừ 100k vào số tiền đã trả. Số tiền khách hàng còn là 50k.
• Lần 2 đi giao nốt món còn lại và thu 50k.• Điều gì sẽ xảy ra nếu ngay món hàng 2 xuất giao, thì món hàng
thứ nhất bị giao lỗi và phải cập nhật lại số tiền của khách hàng? Kịch bản hợp lý nhất: khách hàng không phải trả thêm tiền.
• Nếu hệ thống được chia làm hai service: service để quản lý hàng tại trạm và service quản lý hàng đi giao. Trong trường hợp này handle consistency kiểu gì?
AnalysisKhó khăn:
• Muốn consistency phải gộp hai service làm một —> Ảnh hưởng tới thiết kế tổng thể.
• Hệ thống không thể đảm bảo khi quy trình đã không consistency. VD: nhân viên giao nhận thứ nhất vừa về thì nhân viên thứ hai đã đi, cả hai còn chưa kịp cập nhật qua máy tính.
Solution
• Dùng nghiệp vụ giải quyết: ghi nhận lỗi và hoàn tiền cho khách hàng qua tài khoản ngân hàng
—-> và thống thiết gọi xin lỗi khách hàng :(((
Conclusions• Khi phân chia hệ thống phải đảm bảo dữ liệu là eventually
consistency• Cơ bản không có transaction giữa các data source khác
nhau• Không đồng thời ghi dữ liệu vào nhiều nguồn khác nhau.• Lưu trữ log để đẩy các thay đổi một cách ổn định sang các
data source khác• Nên sử dụng message queue là nền tảng chính cho việc tích
hợp bất đồng bộ giữa các service. Hạn chế sử dụng gọi chéo api.
• Đánh giá việc phân chia service phù hợp với đòi hỏi về consistency dữ liệu.
Thank you!