
Mạng tương tác y học là công cụ biểu diễn mối quan hệ phức tạp và đa chiều của các yếu tố y học. Việc xây dựng mạng theo con đường cổ điển thường bị hạn chế bởi lượng dữ liệu quá lớn và trên một lĩnh vực quá rộng. Gần đây, trí tuệ nhân tạo cho thấy là một phương pháp tiềm năng giải quyết vấn đề trên khi có thể xử lý một lượng thông tin khổng lồ trong thời gian ngắn. Trong nghiên cứu này, chúng tôi đề xuất một phương pháp xây dựng mạng tương tác sử dụng các phương pháp học máy. Cụ thể, các phương pháp xử lý văn bản được dùng để đọc các văn bản, sàng lọc các yếu tố y học. Quy trình đánh giá được xây dựng để lượng hoá mối quan hệ của các yếu tố. Kết quả phân tích thử nghiệm trên 97 tài liệu y văn với 76 nghìn trang và 32 triệu từ, chúng tôi lọc ra được và xây dựng mạng tương tác cho 438 yếu tố có giá trị thống kê cao nhất. Đánh giá mạng thông qua phân tích định tính tính hợp lý của các mối quan hệ như “bệnh - triệu chứng”, “triệu chứng – cơ quan” đã cho thấy sự tương thích cao với các tri thức y học hiện tại. Các kết quả này đã xác nhận sự phù hợp của mạng, cũng như tính khả dụng của mạng khi áp dụng vào các tác vụ phân tích trong y học. Xa hơn, kết quả này cũng góp phần thúc đẩy quá trình áp dụng trí tuệ nhân tạo vào y học.
Medical knowledge graphs are an effective tool to describe the interactions and multidimensional relationships among multiple medical factors. Constructing a knowledge graph depends on the size of the graph, which requires analysis and synthesis of a large amount of information. In today's era of data explosion, the above problem becomes challenging to follow with traditional manual analysis methods. Recently, artificial intelligence has shown promising potential to speed up solving big data problems. Following the same approach, we present a building method of medical knowledge graphs applicating machine learning techniques. Specifically, text processing methods screen and selects important medical keywords, incorporating the evaluation function to quantify the interaction between factors. As a result, after analyzing practically 100 medical documents with 76 thousand pages and 32 million words, we filtered out and created a knowledge graph of 438 keywords. Verifying the value of the graph by qualitative analysis of the rationality of the relationship between "symptom – disease" and "symptom - organ" showed a high correlation, compatible with medical knowledge. These preliminary results show the potential of bridging the two fields of data science and medicine, facilitating the acceleration of hidden knowledge extraction in the medical field.
- Đăng nhập để gửi ý kiến