Yapay zeka algoritmaları, her geçen günle birlikte sağlık sektörünün her alanına girmeye devam ediyor. Meme kanseri görüntülemelerinde, klinik notlar alınmasında, sağlık sigortalarının yönetiminde ve hatta "sanal hemşireler" yaratmakta veya doktor-hasta diyalogları oluşturmakta kullanılıyorlar. Bazı şirketler bu araçların tıp sektörünü daha verimli hale getireceğini, doktorlar ve diğer sağlık çalışanlarının yüklerini hafifleteceğini iddia ediyor.[1] Ancak bazı uzmanlar bu araçların şirketlerin iddia ettiği kadar düzgün çalıştığından şüpheli.
İnsanlara benzer şekilde metin üretebilmek üzere muazzam büyüklükte veriyle eğitilen büyük dil modelleri (LLM'ler) gibi yapay zeka araçları, ancak aldıkları eğitim kadar kaliteli sonuçlar verebilirler. Oysa tıbbi alanda LLM'lerin yetkinliğini ölçmek için kullanılan metrikler tıp fakültelerinin sınavlarına dayanmaktadır. Hatta sağlık sektöründe kullanılan yapay zeka araçlarını değerlendiren bir çalışma, bu modellerin sadece %5'inin gerçek hastalardan elde edilen verilerle eğitildiğini göstermektedir.[2] Dahası, birçok çalışma dil modellerini test etmek için tıbbi bilgilerle ilgili sorular sormakla yetinmiştir. Çok az çalışma modellerin gerçek hayatta şimdiden üstlendiği reçete yazma, konuşma özetleme veya hastalarla konuşma gibi görevlerin ne kadar iyi yapıldığını incelemiştir.