Để trở thành một Software Architect tốt, chúng ta cần có kiến thức và kỹ năng về cả Low level và High Level System Design. Mình sẽ tổng hợp lại 10 thuật toán về system design mà mình nghĩ là rất hữu ích trong công việc, và cũng hữu ích cho các bạn bổ túc kiến thức để tham gia phỏng vấn ở vị trí SA. Bài đầu tiên mình sẽ bắt đầu với Consistent Hashing
LLM hiện nay đã được sử dụng rỗng rãi ở nhiều ngách nhỏ trong các tập đoàn lớn, và càng ngày có càng nhiều công cụ nhỏ được release ra đời nhằm giải quyết các vấn đề hằng ngày phát sinh. Bài viết này mình trích và dịch lại một số bài toán mà các tập đoàn lớn đã gặp phải và họ đã sử dụng LLM để giải quyết nó. Đây cũng là một nguồn thông tin hữu ích cho các doanh nghiệp ứng dụng LLM trong chính doanh nghiệp của mình.
CUDA là một công nghệ tuyệt vời cho phép bạn tận dụng tối đa hiệu suất của GPU Nvidia. Tuy nhiên, nó chỉ hoạt động trên các GPU của NVIDIA và việc chuyển mã CUDA hiện có sang các nền tảng khác không phải lúc nào cũng dễ dàng. Ở bài viết này, chúng ta cùng nhau tìm hiểu các thư viện lập trình song song khác đang tồn tại, ưu và nhược điểm của chúng.
Các phương pháp phân tích dữ liệu lớn là những kỹ thuật và công cụ để xử lý, khai thác và trích xuất thông tin từ dữ liệu có kích thước, tốc độ và đa dạng lớn. Các phương pháp này giúp bạn hiểu được xu hướng, mẫu, mối quan hệ và giá trị tiềm ẩn trong dữ liệu, từ đó đưa ra những quyết định có căn cứ và tối ưu hóa hiệu quả kinh doanh.
Các phương pháp phân tích dữ liệu lớn là những kỹ thuật và công cụ để xử lý, khai thác và trích xuất thông tin từ dữ liệu có kích thước, tốc độ và đa dạng lớn. Các phương pháp này giúp bạn hiểu được xu hướng, mẫu, mối quan hệ và giá trị tiềm ẩn trong dữ liệu, từ đó đưa ra những quyết định có căn cứ và tối ưu hóa hiệu quả kinh doanh.
Mô hình phát triển phần mềm là cách thức tổ chức các hoạt động để tạo ra phần mềm từ việc phân tích yêu cầu đến việc duy trì. Có nhiều loại mô hình phát triển phần mềm khác nhau, nhưng phổ biến nhất là mô hình thác nước, mô hình chữ V, mô hình xoắn ốc, mô hình agile và quy trình scrum. Mỗi mô hình có ưu và nhược điểm riêng, phù hợp với các loại dự án và khách hàng khác nhau.
Data Analytics đang là ngành hot ở thời điểm hiện tại, tuy nhiên, mức độ cạnh trang của ngành này khá cao, chúng ta thường không thấy tuyển intern cho vị trí này.
Phân cụm theo cửa hàng, phân cụm theo danh mục, phân cụm theo nhóm danh mục, là một trong các yếu tố | công cụ tốt giúp cho khối sale, khối marketing đưa ra các quyết định sáng suốt. Thông thường thì chúng ta sẽ phân loại các siêu thị thành các cụm, tuy nhiên, có vẻ như việc phân loại theo nhóm danh mục hoặc danh mục sẽ phù hợp hơn với mục tiêu kinh doanh | mục tiêu marketing. Ví dụ, việc phân loại theo danh mục sẽ cho phép chúng ta tiếp cận đến khoảng mục tiêu (target range) tốt hơn, và đưa ra các chương trình khuyến mãi phù hợp nhất với những nhu cầu của nhóm đó mang tới.
Bằng cách đưa cách tiếp cận phát triển sản phẩm vào việc lập kế hoạch và thực hiện phân tích, các tổ chức có thể mở rộng các thành công riêng biệt thành loại ra quyết định dựa trên dữ liệu bền vững, toàn tổ chức, đóng vai trò là nền tảng của chuyển đổi kỹ thuật số thực sự.
Chi phí liên quan đến n-gram tokenizer ở ElasticSearch và opensearch thường không đề cập chi tiết trong các tài liệu, do đó, có khi nó sẽ gây ra các hậu quả khá nghiêm trọng về chi phí và hiệu năng. Dẫn đến trường hợp là chúng ta phải "lấy thịt đè người" bằng cách tăng chi phí phần cứng một cách lãng phí. Trong bài viết này, chúng ta sẽ đề cập đến vài use-case sử dụng n-gram tokenizer, một số phương pháp cải tiến, hoặc một vài phương pháp thay thế nó bằng cách khách hiệu quả hơn.