Cảm ơn bạn đã truy cập nature.com. Phiên bản trình duyệt bạn đang sử dụng có hỗ trợ CSS hạn chế. Để có trải nghiệm tốt nhất, chúng tôi khuyên bạn nên sử dụng phiên bản trình duyệt mới nhất (hoặc tắt chế độ tương thích trong Internet Explorer). Ngoài ra, để đảm bảo hỗ trợ liên tục, trang web này sẽ không sử dụng kiểu dáng và JavaScript.
Cơ xương là một mô không đồng nhất, chủ yếu bao gồm các sợi cơ (myofibril), ở người thường được phân loại thành ba loại: một loại “chậm” (loại 1) và hai loại “nhanh” (loại 2A và 2X). Tuy nhiên, sự không đồng nhất giữa và trong các loại sợi cơ truyền thống vẫn chưa được hiểu rõ. Chúng tôi đã áp dụng các phương pháp phân tích biểu hiện gen (transcriptomics) và protein (proteomics) cho lần lượt 1050 và 1038 sợi cơ riêng lẻ từ cơ vastus lateralis của người. Nghiên cứu protein bao gồm nam giới, và nghiên cứu biểu hiện gen bao gồm 10 nam giới và 2 nữ giới. Ngoài các dạng đồng phân của chuỗi nặng myosin, chúng tôi đã xác định các protein chuyển hóa, protein ribosome và protein liên kết tế bào là nguồn gốc của sự biến đổi đa chiều giữa các sợi cơ. Hơn nữa, mặc dù đã xác định được các cụm sợi chậm và nhanh, dữ liệu của chúng tôi cho thấy các sợi loại 2X không thể phân biệt được về mặt kiểu hình với các sợi co nhanh khác. Hơn nữa, phân loại dựa trên chuỗi nặng myosin là không đủ để mô tả kiểu hình sợi cơ trong bệnh loạn dưỡng cơ dạng sợi nemaline. Nhìn chung, dữ liệu của chúng tôi cho thấy tính không đồng nhất đa chiều của sợi cơ, với các nguồn biến đổi vượt ra ngoài các dạng đồng phân của chuỗi nặng myosin.
Tính không đồng nhất của tế bào là một đặc điểm vốn có của tất cả các hệ thống sinh học, cho phép các tế bào chuyên hóa để đáp ứng các nhu cầu khác nhau của mô và tế bào.1 Quan điểm truyền thống về tính không đồng nhất của sợi cơ xương cho rằng các tế bào thần kinh vận động xác định loại sợi trong một đơn vị vận động, và loại sợi (ví dụ: loại 1, loại 2A và loại 2X ở người) được xác định bởi các đặc điểm của các dạng đồng phân chuỗi nặng myosin (MYH).2 Điều này ban đầu dựa trên sự không ổn định pH ATPase của chúng,3,4 và sau đó là sự biểu hiện phân tử của MYH.5 Tuy nhiên, với việc xác định và chấp nhận các sợi “hỗn hợp” cùng biểu hiện nhiều MYH với tỷ lệ khác nhau, các sợi cơ xương ngày càng được xem như một thể liên tục hơn là các loại sợi riêng biệt.6 Mặc dù vậy, lĩnh vực này vẫn phụ thuộc rất nhiều vào MYH như là yếu tố phân loại chính để phân loại sợi cơ, một quan điểm có thể bị ảnh hưởng bởi những hạn chế và thành kiến đáng kể của các nghiên cứu trên động vật gặm nhấm thời kỳ đầu, trong đó hồ sơ biểu hiện MYH và phạm vi các loại sợi khác với ở người.2 Tình hình càng phức tạp hơn bởi thực tế là các cơ xương khác nhau của con người thể hiện một loạt các loại sợi đa dạng.7 Cơ vastus lateralis là một cơ hỗn hợp với cấu hình biểu hiện MYH trung gian (và do đó mang tính đại diện).7 Hơn nữa, việc dễ dàng lấy mẫu khiến nó trở thành cơ được nghiên cứu kỹ lưỡng nhất ở người.
Do đó, việc điều tra khách quan về sự đa dạng của các sợi cơ xương bằng cách sử dụng các công cụ “omics” mạnh mẽ là rất quan trọng nhưng cũng đầy thách thức, một phần là do bản chất đa nhân của các sợi cơ xương. Tuy nhiên, công nghệ transcriptomics8,9 và proteomics10 đã trải qua một cuộc cách mạng về độ nhạy trong những năm gần đây nhờ nhiều tiến bộ công nghệ khác nhau, cho phép phân tích cơ xương ở độ phân giải từng sợi. Kết quả là, đã có những tiến bộ đáng kể trong việc mô tả sự đa dạng của từng sợi và phản ứng của chúng đối với các kích thích teo cơ và lão hóa11,12,13,14,15,16,17,18. Quan trọng hơn, những tiến bộ công nghệ này có ứng dụng lâm sàng, cho phép mô tả chi tiết và chính xác hơn về sự rối loạn liên quan đến bệnh. Ví dụ, sinh lý bệnh của bệnh loạn dưỡng cơ dạng sợi nemaline, một trong những bệnh cơ di truyền phổ biến nhất (MIM 605355 và MIM 161800), rất phức tạp và khó hiểu.19,20 Do đó, việc mô tả tốt hơn về sự rối loạn của các sợi cơ xương có thể dẫn đến những tiến bộ đáng kể trong hiểu biết của chúng ta về căn bệnh này.
Chúng tôi đã phát triển các phương pháp phân tích transcriptome và proteome của các sợi cơ xương đơn lẻ được phân lập thủ công từ các mẫu sinh thiết của con người và áp dụng chúng cho hàng nghìn sợi cơ, cho phép chúng tôi nghiên cứu tính không đồng nhất tế bào của các sợi cơ xương người. Trong quá trình nghiên cứu này, chúng tôi đã chứng minh sức mạnh của việc phân tích kiểu hình transcriptome và proteome của các sợi cơ và xác định các protein chuyển hóa, ribosome và protein liên kết tế bào là những nguồn quan trọng gây ra sự biến đổi giữa các sợi cơ. Hơn nữa, bằng cách sử dụng quy trình proteome này, chúng tôi đã mô tả đặc điểm liên quan lâm sàng của bệnh cơ do giun tròn ở các sợi cơ xương đơn lẻ, cho thấy sự chuyển dịch phối hợp hướng tới các sợi không oxy hóa độc lập với loại sợi dựa trên MYH.
Để nghiên cứu tính không đồng nhất của các sợi cơ xương người, chúng tôi đã phát triển hai quy trình làm việc cho phép phân tích transcriptome và proteome của từng sợi cơ xương riêng lẻ (Hình 1A và Hình bổ sung 1A). Chúng tôi đã phát triển và tối ưu hóa một số bước phương pháp luận, từ lưu trữ mẫu và bảo toàn tính toàn vẹn của RNA và protein đến tối ưu hóa thông lượng cho mỗi phương pháp. Đối với phân tích transcriptome, điều này đạt được bằng cách chèn mã vạch phân tử đặc hiệu mẫu ở bước đầu tiên của quá trình phiên mã ngược, cho phép gộp 96 sợi để xử lý hiệu quả hơn. Trình tự sâu hơn (±1 triệu lượt đọc mỗi sợi) so với các phương pháp tế bào đơn truyền thống đã làm phong phú thêm dữ liệu transcriptome. 21 Đối với proteomics, chúng tôi đã sử dụng gradient sắc ký ngắn (21 phút) kết hợp với thu thập dữ liệu DIA-PASEF trên máy quang phổ khối timsTOF để tối ưu hóa độ sâu proteome trong khi vẫn duy trì thông lượng cao. 22,23 Để nghiên cứu tính không đồng nhất của các sợi cơ xương khỏe mạnh, chúng tôi đã phân tích transcriptome của 1.050 sợi riêng lẻ từ 14 người hiến tặng trưởng thành khỏe mạnh và proteome của 1.038 sợi từ 5 người hiến tặng trưởng thành khỏe mạnh (Bảng bổ sung 1). Trong bài báo này, các tập dữ liệu này được gọi tương ứng là transcriptome và proteome của 1.000 sợi. Phương pháp của chúng tôi đã phát hiện tổng cộng 27.237 bản sao và 2.983 protein trong phân tích transcriptome và proteome của 1.000 sợi (Hình 1A, Tập dữ liệu bổ sung 1–2). Sau khi lọc các tập dữ liệu transcriptome và proteome cho >1.000 gen được phát hiện và 50% giá trị hợp lệ trên mỗi sợi, các phân tích tin sinh học tiếp theo đã được thực hiện cho 925 và 974 sợi trong transcriptome và proteome, tương ứng. Sau khi lọc, trung bình có 4257 ± 1557 gen và 2015 ± 234 protein (trung bình ± độ lệch chuẩn) được phát hiện trên mỗi sợi cơ, với sự biến thiên giữa các cá thể hạn chế (Hình bổ sung 1B–C, Bộ dữ liệu bổ sung 3–4). Tuy nhiên, sự biến thiên trong cùng một đối tượng rõ rệt hơn giữa các người tham gia, có thể do sự khác biệt về lượng RNA/protein giữa các sợi cơ có chiều dài và diện tích mặt cắt ngang khác nhau. Đối với hầu hết các protein (>2000), hệ số biến thiên dưới 20% (Hình bổ sung 1D). Cả hai phương pháp đều cho phép thu thập một phạm vi động rộng của các bản sao và protein có dấu hiệu biểu hiện cao quan trọng cho sự co cơ (ví dụ: ACTA1, MYH2, MYH7, TNNT1, TNNT3) (Hình bổ sung 1E–F). Hầu hết các đặc điểm được xác định đều phổ biến giữa các bộ dữ liệu phiên mã và protein (Hình bổ sung 1G), và cường độ UMI/LFQ trung bình của các đặc điểm này có mối tương quan khá tốt (r = 0,52) (Hình bổ sung 1H).
Quy trình phân tích transcriptomics và proteomics (được tạo bằng BioRender.com). BD Đường cong phạm vi động cho MYH7, MYH2 và MYH1, và ngưỡng được tính toán để phân loại loại sợi. E, F Phân bố biểu hiện MYH trên các sợi trong bộ dữ liệu transcriptomics và proteomics. G, H Biểu đồ Ước lượng và Chiếu Đa dạng Đồng nhất (UMAP) cho transcriptomics và proteomics được tô màu theo loại sợi dựa trên MYH. I, J Biểu đồ đặc trưng hiển thị biểu hiện MYH7, MYH2 và MYH1 trong bộ dữ liệu transcriptomics và proteomics.
Ban đầu, chúng tôi đặt mục tiêu gán loại sợi dựa trên MYH cho từng sợi bằng cách sử dụng phương pháp tối ưu hóa, tận dụng độ nhạy cao và phạm vi động của biểu hiện MYH trong các bộ dữ liệu omics. Các nghiên cứu trước đây đã sử dụng ngưỡng tùy ý để dán nhãn các sợi là loại 1 thuần túy, loại 2A, loại 2X hoặc hỗn hợp dựa trên tỷ lệ phần trăm biểu hiện cố định của các MYH khác nhau11,14,24. Chúng tôi đã sử dụng một phương pháp khác, trong đó biểu hiện của mỗi sợi được xếp hạng theo các MYH mà chúng tôi sử dụng để phân loại các sợi: MYH7, MYH2 và MYH1, tương ứng với các sợi loại 1, loại 2A và loại 2X. Sau đó, chúng tôi tính toán toán học điểm uốn dưới của mỗi đường cong thu được và sử dụng nó làm ngưỡng để gán các sợi là dương tính (trên ngưỡng) hoặc âm tính (dưới ngưỡng) cho mỗi MYH (Hình 1B–D). Dữ liệu này cho thấy MYH7 (Hình 1B) và MYH2 (Hình 1C) có cấu hình biểu hiện bật/tắt rõ ràng hơn ở cấp độ RNA so với cấp độ protein. Thật vậy, ở cấp độ protein, rất ít sợi cơ không biểu hiện MYH7, và không có sợi cơ nào biểu hiện MYH2 100%. Tiếp theo, chúng tôi sử dụng ngưỡng biểu hiện được xác định trước để gán loại sợi cơ dựa trên MYH cho tất cả các sợi cơ trong mỗi tập dữ liệu. Ví dụ, các sợi MYH7+/MYH2-/MYH1- được gán vào loại 1, trong khi các sợi MYH7-/MYH2+/MYH1+ được gán vào loại hỗn hợp 2A/2X (xem Bảng bổ sung 2 để biết mô tả đầy đủ). Khi gộp tất cả các sợi cơ lại, chúng tôi quan sát thấy sự phân bố các loại sợi cơ dựa trên MYH tương tự đáng kể ở cả cấp độ RNA (Hình 1E) và protein (Hình 1F), trong khi thành phần tương đối của các loại sợi cơ dựa trên MYH khác nhau giữa các cá thể, như dự kiến (Hình bổ sung 2A). Hầu hết các sợi cơ được phân loại là loại 1 thuần túy (34–35%) hoặc loại 2A (36–38%), mặc dù cũng phát hiện thấy một số lượng đáng kể các sợi cơ loại hỗn hợp 2A/2X (16–19%). Một điểm khác biệt đáng chú ý là các sợi loại 2X thuần túy chỉ có thể được phát hiện ở cấp độ RNA, chứ không phải ở cấp độ protein, cho thấy rằng sự biểu hiện MYH nhanh chóng ít nhất một phần được điều chỉnh sau phiên mã.
Chúng tôi đã xác thực phương pháp phân loại sợi MYH dựa trên proteomics bằng cách sử dụng phương pháp chấm blot dựa trên kháng thể, và cả hai phương pháp đều đạt được sự trùng khớp 100% trong việc xác định các sợi loại 1 và loại 2A thuần túy (xem Hình bổ sung 2B). Tuy nhiên, phương pháp dựa trên proteomics nhạy hơn, hiệu quả hơn trong việc xác định các sợi hỗn hợp và định lượng tỷ lệ của mỗi gen MYH trong mỗi sợi. Những dữ liệu này chứng minh hiệu quả của việc sử dụng phương pháp dựa trên omics khách quan, có độ nhạy cao để đặc trưng hóa các loại sợi cơ xương.
Sau đó, chúng tôi sử dụng thông tin kết hợp từ transcriptomics và proteomics để phân loại khách quan các sợi cơ dựa trên transcriptome hoặc proteome hoàn chỉnh của chúng. Sử dụng phương pháp xấp xỉ và chiếu đa tạp đồng nhất (UMAP) để giảm chiều xuống còn sáu thành phần chính (Hình bổ sung 3A–B), chúng tôi có thể hình dung sự biến đổi của sợi cơ trong transcriptome (Hình 1G) và proteome (Hình 1H). Đáng chú ý, các sợi cơ không được nhóm theo người tham gia (Hình bổ sung 3C–D) hoặc ngày thử nghiệm (Hình bổ sung 3E) trong cả bộ dữ liệu transcriptomics và proteomics, cho thấy sự biến đổi trong cùng một đối tượng ở các sợi cơ xương cao hơn sự biến đổi giữa các đối tượng. Trong biểu đồ UMAP, hai cụm riêng biệt đại diện cho các sợi cơ “nhanh” và “chậm” đã xuất hiện (Hình 1G–H). Các sợi cơ MYH7+ (chậm) tập trung ở cực dương của UMAP1, trong khi các sợi cơ MYH2+ và MYH1+ (nhanh) tập trung ở cực âm của UMAP1 (Hình 1I–J). Tuy nhiên, không có sự phân biệt nào được thực hiện giữa các loại sợi cơ co nhanh (tức là loại 2A, loại 2X hoặc hỗn hợp 2A/2X) dựa trên biểu hiện MYH, cho thấy rằng biểu hiện MYH1 (Hình 1I–J) hoặc các dấu ấn sợi cơ 2X cổ điển khác như ACTN3 hoặc MYLK2 (Hình bổ sung 4A–B) không phân biệt được giữa các loại sợi cơ khác nhau khi xem xét toàn bộ transcriptome hoặc proteome. Hơn nữa, so với MYH2 và MYH7, chỉ có một số ít bản sao hoặc protein tương quan dương tính với MYH1 (Hình bổ sung 4C–H), cho thấy rằng sự phong phú của MYH1 không phản ánh đầy đủ transcriptome/proteome của sợi cơ. Các kết luận tương tự cũng được đưa ra khi đánh giá sự biểu hiện hỗn hợp của ba dạng MYH ở cấp độ UMAP (Hình bổ sung 4I–J). Do đó, trong khi các sợi 2X có thể được xác định ở cấp độ phiên mã dựa trên định lượng MYH đơn thuần, thì các sợi MYH1+ không thể phân biệt được với các sợi nhanh khác khi xem xét toàn bộ hệ gen hoặc hệ protein.
Để tìm hiểu sơ bộ về tính không đồng nhất của sợi cơ chậm ngoài MYH, chúng tôi đã đánh giá bốn protein đặc hiệu cho từng loại sợi cơ chậm: TPM3, TNNT1, MYL3 và ATP2A22. Các phân nhóm sợi cơ chậm cho thấy hệ số tương quan Pearson cao, mặc dù không hoàn hảo, với MYH7 trong cả phân tích biểu hiện gen (Hình bổ sung 5A) và phân tích protein (Hình bổ sung 5B). Khoảng 25% và 33% sợi cơ chậm không được phân loại là sợi cơ chậm thuần túy bởi tất cả các phân nhóm gen/protein trong phân tích biểu hiện gen (Hình bổ sung 5C) và phân tích protein (Hình bổ sung 5D), tương ứng. Do đó, việc phân loại sợi cơ chậm dựa trên nhiều phân nhóm gen/protein sẽ làm tăng thêm độ phức tạp, ngay cả đối với các protein được biết là đặc hiệu cho từng loại sợi cơ. Điều này cho thấy rằng việc phân loại sợi cơ dựa trên các dạng đồng phân của một họ gen/protein duy nhất có thể không phản ánh đầy đủ tính không đồng nhất thực sự của các sợi cơ xương.
Để khám phá sâu hơn sự biến đổi kiểu hình của các sợi cơ xương người ở quy mô toàn bộ mô hình omics, chúng tôi đã thực hiện giảm chiều dữ liệu không thiên vị bằng cách sử dụng phân tích thành phần chính (PCA) (Hình 2A). Tương tự như biểu đồ UMAP, cả người tham gia lẫn ngày thử nghiệm đều không ảnh hưởng đến sự phân cụm sợi ở cấp độ PCA (Hình bổ sung 6A–C). Trong cả hai bộ dữ liệu, loại sợi dựa trên MYH được giải thích bởi PC2, cho thấy một cụm các sợi co chậm loại 1 và một cụm thứ hai chứa các sợi co nhanh loại 2A, loại 2X và sợi hỗn hợp 2A/2X (Hình 2A). Trong cả hai bộ dữ liệu, hai cụm này được kết nối bởi một số lượng nhỏ các sợi hỗn hợp loại 1/2A. Như dự đoán, phân tích sự hiện diện quá mức của các yếu tố điều khiển PC chính đã xác nhận rằng PC2 được điều khiển bởi các dấu hiệu co cơ và chuyển hóa (Hình 2B và Hình bổ sung 6D–E, Bộ dữ liệu bổ sung 5–6). Nhìn chung, loại sợi dựa trên MYH được cho là đủ để giải thích sự biến đổi liên tục dọc theo PC2, ngoại trừ các sợi được gọi là 2X phân bố khắp hệ gen trong cụm nhanh.
A. Biểu đồ phân tích thành phần chính (PCA) của tập dữ liệu transcriptome và proteome được tô màu theo loại sợi cơ dựa trên MYH. B. Phân tích làm giàu các yếu tố điều khiển phiên mã và protein trong PC2 và PC1. Phân tích thống kê được thực hiện bằng cách sử dụng gói clusterProfiler và giá trị p được điều chỉnh theo Benjamini-Hochberg. C, D. Biểu đồ PCA được tô màu theo các thuật ngữ phân loại chức năng gen (GO) về sự kết dính giữa các tế bào trong transcriptome và các thuật ngữ GO về costamere trong proteome. Các mũi tên biểu thị các yếu tố điều khiển phiên mã và protein và hướng của chúng. E, F. Biểu đồ đặc trưng xấp xỉ và chiếu đa tạp đồng nhất (UMAP) của các đặc điểm có liên quan đến lâm sàng cho thấy độ dốc biểu hiện độc lập với loại sợi cơ chậm/nhanh. G, H. Mối tương quan giữa các yếu tố điều khiển PC2 và PC1 trong transcriptome và proteome.
Thật bất ngờ, loại sợi cơ dựa trên MYH chỉ giải thích được mức độ biến thiên cao thứ hai (PC2), cho thấy rằng các yếu tố sinh học khác không liên quan đến loại sợi cơ dựa trên MYH (PC1) đóng vai trò quan trọng trong việc điều chỉnh tính không đồng nhất của sợi cơ xương. Phân tích sự hiện diện quá mức của các yếu tố điều khiển hàng đầu trong PC1 cho thấy rằng sự biến thiên trong PC1 chủ yếu được xác định bởi sự kết dính giữa các tế bào và hàm lượng ribosome trong transcriptome, và costamere và protein ribosome trong proteome (Hình 2B và Hình bổ sung 6D–E, Bộ dữ liệu bổ sung 7). Trong cơ xương, costamere kết nối đĩa Z với màng tế bào và tham gia vào quá trình truyền lực và truyền tín hiệu. 25 Biểu đồ PCA được chú thích bằng cách sử dụng các đặc điểm kết dính giữa các tế bào (transcriptome, Hình 2C) và costamere (proteome, Hình 2D) cho thấy sự dịch chuyển mạnh sang trái trong PC1, cho thấy rằng các đặc điểm này được làm giàu trong một số loại sợi nhất định.
Phân tích chi tiết hơn về sự phân cụm sợi cơ ở cấp độ UMAP cho thấy hầu hết các đặc điểm đều thể hiện gradient biểu hiện dựa trên MYH độc lập với loại sợi cơ, chứ không phải đặc trưng cho từng cụm nhỏ sợi cơ. Tính liên tục này được quan sát thấy ở một số gen liên quan đến các bệnh lý (Hình 2E), chẳng hạn như CHCHD10 (bệnh thần kinh cơ), SLIT3 (teo cơ), CTDNEP1 (bệnh cơ). Tính liên tục này cũng được quan sát thấy trên toàn bộ hệ protein, bao gồm các protein liên quan đến rối loạn thần kinh (UGDH), tín hiệu insulin (PHIP) và phiên mã (HIST1H2AB) (Hình 2F). Nhìn chung, những dữ liệu này cho thấy tính liên tục trong sự không đồng nhất của co giật chậm/nhanh độc lập với loại sợi cơ trên các sợi cơ khác nhau.
Điều thú vị là, các gen điều khiển trong PC2 cho thấy mối tương quan tốt giữa transcriptome và proteome (r = 0,663) (Hình 2G), cho thấy rằng các loại sợi cơ co chậm và co nhanh, và đặc biệt là các đặc tính co bóp và chuyển hóa của các sợi cơ xương, được điều chỉnh ở cấp độ phiên mã. Tuy nhiên, các gen điều khiển trong PC1 không cho thấy mối tương quan giữa transcriptome và proteome (r = -0,027) (Hình 2H), cho thấy rằng các biến thể không liên quan đến loại sợi cơ co chậm/co nhanh chủ yếu được điều chỉnh ở cấp độ sau phiên mã. Bởi vì các biến thể trong PC1 chủ yếu được giải thích bằng các thuật ngữ phân loại gen ribosome, và do ribosome đóng vai trò quan trọng và chuyên biệt trong tế bào bằng cách tích cực tham gia và ảnh hưởng đến quá trình dịch mã protein,31 chúng tôi tiếp theo đã tiến hành điều tra sự không đồng nhất ribosome bất ngờ này.
Đầu tiên, chúng tôi tô màu biểu đồ phân tích thành phần chính (PCA) của proteomics dựa trên sự phong phú tương đối của các protein trong thuật ngữ GOCC “ribosome tế bào chất” (Hình 3A). Mặc dù thuật ngữ này được làm giàu ở phía dương của PC1, dẫn đến một gradient nhỏ, nhưng các protein ribosome thúc đẩy sự phân chia theo cả hai hướng của PC1 (Hình 3A). Các protein ribosome được làm giàu ở phía âm của PC1 bao gồm RPL18, RPS18 và RPS13 (Hình 3B), trong khi RPL31, RPL35 và RPL38 (Hình 3C) là những yếu tố chính thúc đẩy ở phía dương của PC1. Điều thú vị là, RPL38 và RPS13 được biểu hiện cao trong cơ xương so với các mô khác (Hình bổ sung 7A). Những dấu hiệu ribosome đặc trưng này trong PC1 không được quan sát thấy trong transcriptome (Hình bổ sung 7B), cho thấy sự điều hòa sau phiên mã.
A. Biểu đồ phân tích thành phần chính (PCA) được tô màu theo các thuật ngữ phân loại chức năng gen (GO) của ribosome tế bào chất trên toàn bộ hệ protein. Mũi tên chỉ hướng biến đổi do protein gây ra trong biểu đồ PCA. Độ dài đường thẳng tương ứng với điểm số thành phần chính cho một protein nhất định. B, C. Biểu đồ đặc trưng PCA cho RPS13 và RPL38. D. Phân tích phân cụm phân cấp không giám sát các protein ribosome tế bào chất. E. Mô hình cấu trúc của ribosome 80S (PDB: 4V6X) làm nổi bật các protein ribosome có hàm lượng khác nhau trong các sợi cơ xương. F. Các protein ribosome với tỷ lệ phối hợp khác nhau được định vị gần kênh thoát mRNA.
Các khái niệm về tính không đồng nhất và chuyên môn hóa của ribosome đã được đề xuất trước đây, theo đó sự hiện diện của các quần thể ribosome riêng biệt (tính không đồng nhất của ribosome) có thể ảnh hưởng trực tiếp đến quá trình dịch mã protein trong các mô32 và tế bào33 khác nhau thông qua quá trình dịch mã chọn lọc các nhóm bản sao mRNA cụ thể34 (chuyên môn hóa ribosome). Để xác định các quần thể protein ribosome được biểu hiện đồng thời trong các sợi cơ xương, chúng tôi đã thực hiện phân tích phân cụm phân cấp không giám sát các protein ribosome trong proteome (Hình 3D, Bộ dữ liệu bổ sung 8). Như dự đoán, các protein ribosome không được phân cụm theo loại sợi dựa trên MYH. Tuy nhiên, chúng tôi đã xác định được ba cụm protein ribosome riêng biệt; cụm đầu tiên (ribosomal_cluster_1) được điều hòa đồng thời với RPL38 và do đó có biểu hiện tăng lên trong các sợi có cấu hình PC1 dương tính. Cụm thứ hai (ribosomal_cluster_2) được điều hòa đồng thời với RPS13 và tăng cao trong các sợi có cấu hình PC1 âm tính. Cụm thứ ba (ribosomal_cluster_3) không thể hiện sự biểu hiện khác biệt phối hợp trong các sợi cơ xương và có thể được coi là protein ribosome cơ xương “cốt lõi”. Cả hai cụm ribosome 1 và 2 đều chứa các protein ribosome đã được chứng minh trước đây là có khả năng điều chỉnh quá trình dịch mã thay thế (ví dụ: RPL10A, RPL38, RPS19 và RPS25) và ảnh hưởng đến sự phát triển về mặt chức năng (ví dụ: RPL10A, RPL38).34,35,36,37,38 Phù hợp với kết quả PCA, sự phân bố không đồng nhất của các protein ribosome này trên các sợi cũng cho thấy tính liên tục (Hình bổ sung 7C).
Để hình dung vị trí của các protein ribosome không đồng nhất bên trong ribosome, chúng tôi đã sử dụng mô hình cấu trúc của ribosome 80S người (Ngân hàng dữ liệu protein: 4V6X) (Hình 3E). Sau khi phân lập các protein ribosome thuộc các cụm ribosome khác nhau, vị trí của chúng không được sắp xếp gần nhau, cho thấy phương pháp của chúng tôi đã không làm giàu được một số vùng/phần nhất định của ribosome. Tuy nhiên, điều thú vị là tỷ lệ protein tiểu đơn vị lớn trong cụm 2 thấp hơn so với cụm 1 và 3 (Hình bổ sung 7D). Chúng tôi quan sát thấy rằng các protein có tỷ lệ thành phần thay đổi trong các sợi cơ xương chủ yếu được định vị trên bề mặt ribosome (Hình 3E), phù hợp với khả năng tương tác của chúng với các yếu tố vị trí nhập ribosome nội bộ (IRES) trong các quần thể mRNA khác nhau, do đó phối hợp quá trình dịch mã chọn lọc. 40, 41 Hơn nữa, nhiều protein có tỷ lệ thành phần thay đổi trong các sợi cơ xương nằm gần các vùng chức năng như đường hầm thoát mRNA (Hình 3F), nơi điều chỉnh chọn lọc sự kéo dài dịch mã và sự dừng lại của các peptide cụ thể. 42 Tóm lại, dữ liệu của chúng tôi cho thấy tỷ lệ thành phần của protein ribosome cơ xương có tính không đồng nhất, dẫn đến sự khác biệt giữa các sợi cơ xương.
Tiếp theo, chúng tôi tiến hành xác định các dấu hiệu đặc trưng của sợi cơ co nhanh và co chậm, đồng thời khám phá cơ chế điều hòa phiên mã của chúng. Bằng cách so sánh các cụm sợi cơ co nhanh và co chậm được xác định bởi UMAP trong hai bộ dữ liệu (Hình 1G–H và 4A–B), phân tích phiên mã và protein đã xác định được lần lượt 1366 và 804 đặc điểm có sự khác biệt về mức độ biểu hiện (Hình 4A–B, Bộ dữ liệu bổ sung 9–12). Chúng tôi quan sát thấy sự khác biệt dự kiến trong các dấu hiệu liên quan đến sarcomere (ví dụ: tropomyosin và troponin), khớp nối kích thích-co cơ (các dạng SERCA) và chuyển hóa năng lượng (ví dụ: ALDOA và CKB). Hơn nữa, các bản phiên mã và protein điều hòa quá trình ubiquitin hóa protein được biểu hiện khác biệt ở các sợi cơ co nhanh và co chậm (ví dụ: USP54, SH3RF2, USP28 và USP48) (Hình 4A–B). Hơn nữa, gen protein vi khuẩn RP11-451G4.2 (DWORF), trước đây đã được chứng minh là biểu hiện khác biệt giữa các loại sợi cơ cừu43 và tăng cường hoạt động SERCA trong cơ tim44, đã được điều chỉnh tăng đáng kể trong các sợi cơ xương chậm (Hình 4A). Tương tự, ở cấp độ từng sợi riêng lẻ, sự khác biệt đáng kể đã được quan sát thấy ở các dấu hiệu đã biết như các dạng đồng phân lactate dehydrogenase liên quan đến chuyển hóa (LDHA và LDHB, Hình 4C và Hình bổ sung 8A)45,46 cũng như các dấu hiệu đặc hiệu loại sợi chưa được biết đến trước đây (chẳng hạn như IRX3, USP54, USP28 và DPYSL3) (Hình 4C). Có sự chồng chéo đáng kể về các đặc điểm biểu hiện khác biệt giữa các tập dữ liệu phiên mã và protein (Hình bổ sung 8B), cũng như mối tương quan thay đổi gấp bội chủ yếu do sự biểu hiện khác biệt rõ rệt hơn của các đặc điểm sarcomere (Hình bổ sung 8C). Đáng chú ý, một số dấu hiệu (ví dụ: USP28, USP48, GOLGA4, AKAP13) chỉ thể hiện sự điều hòa sau phiên mã mạnh mẽ ở cấp độ protein và có hồ sơ biểu hiện đặc trưng theo loại sợi cơ co chậm/nhanh (Hình bổ sung 8C).
Biểu đồ núi lửa A và B so sánh các cụm chậm và nhanh được xác định bằng phương pháp xấp xỉ và chiếu đa tạp đồng nhất (UMAP) trong Hình 1G–H. Các chấm màu biểu thị các bản sao hoặc protein khác biệt đáng kể ở mức FDR < 0,05, và các chấm đậm hơn biểu thị các bản sao hoặc protein khác biệt đáng kể ở mức thay đổi logarit > 1. Phân tích thống kê hai chiều được thực hiện bằng cách sử dụng kiểm định Wald của DESeq2 với giá trị p được điều chỉnh theo Benjamini–Hochberg (phân tích biểu hiện gen) hoặc phương pháp mô hình tuyến tính Limma với phân tích Bayes thực nghiệm, tiếp theo là điều chỉnh Benjamini–Hochberg cho nhiều phép so sánh (phân tích protein). C Biểu đồ đặc trưng của các gen hoặc protein được biểu hiện khác biệt được chọn giữa các sợi chậm và nhanh. D Phân tích làm giàu các bản sao và protein được biểu hiện khác biệt đáng kể. Các giá trị chồng chéo được làm giàu trong cả hai tập dữ liệu, các giá trị biểu hiện gen chỉ được làm giàu trong tập dữ liệu biểu hiện gen, và các giá trị protein chỉ được làm giàu trong tập dữ liệu protein. Phân tích thống kê được thực hiện bằng cách sử dụng gói clusterProfiler với giá trị p được điều chỉnh theo Benjamini-Hochberg. E. Các yếu tố phiên mã đặc hiệu cho từng loại sợi cơ được xác định bởi SCENIC dựa trên điểm số đặc hiệu của bộ điều hòa do SCENIC tạo ra và sự biểu hiện mRNA khác biệt giữa các loại sợi cơ. F. Phân tích đặc điểm của các yếu tố phiên mã được chọn có biểu hiện khác biệt giữa các sợi cơ chậm và nhanh.
Sau đó, chúng tôi đã thực hiện phân tích đại diện quá mức của các gen và protein được đại diện khác biệt (Hình 4D, Bộ dữ liệu bổ sung 13). Sự làm giàu đường dẫn cho các đặc điểm khác nhau giữa hai bộ dữ liệu đã tiết lộ những khác biệt dự kiến, chẳng hạn như quá trình oxy hóa β axit béo và quá trình chuyển hóa ketone (sợi chậm), sự co cơ/sợi cơ (sợi nhanh và chậm, tương ứng) và các quá trình dị hóa carbohydrate (sợi nhanh). Hoạt động phosphatase protein serine/threonine cũng tăng cao ở các sợi nhanh, được thúc đẩy bởi các đặc điểm như các tiểu đơn vị phosphatase điều hòa và xúc tác (PPP3CB, PPP1R3D và PPP1R3A), được biết là điều chỉnh quá trình chuyển hóa glycogen (47) (Hình bổ sung 8D–E). Các con đường khác được làm giàu trong các sợi nhanh bao gồm các thể xử lý (P-) (YTHDF3, TRIM21, LSM2) trong proteome (Hình bổ sung 8F), có khả năng liên quan đến điều hòa sau phiên mã (48) và hoạt động của yếu tố phiên mã (SREBF1, RXRG, RORA) trong transcriptome (Hình bổ sung 8G). Các sợi chậm được làm giàu trong hoạt động oxy hóa khử (BDH1, DCXR, TXN2) (Hình bổ sung 8H), liên kết amide (CPTP, PFDN2, CRYAB) (Hình bổ sung 8I), ma trận ngoại bào (CTSD, ADAMTSL4, LAMC1) (Hình bổ sung 8J) và hoạt động thụ thể-ligand (FNDC5, SPX, NENF) (Hình bổ sung 8K).
Để hiểu rõ hơn về cơ chế điều hòa phiên mã chi phối đặc điểm loại sợi cơ chậm/nhanh, chúng tôi đã thực hiện phân tích làm giàu yếu tố phiên mã bằng SCENIC49 (Bộ dữ liệu bổ sung 14). Nhiều yếu tố phiên mã được làm giàu đáng kể giữa các sợi cơ nhanh và chậm (Hình 4E). Điều này bao gồm các yếu tố phiên mã như MAFA, trước đây đã được liên kết với sự phát triển của sợi cơ nhanh,50 cũng như một số yếu tố phiên mã chưa từng được liên kết với các chương trình gen đặc hiệu cho từng loại sợi cơ. Trong số này, PITX1, EGR1 và MYF6 là những yếu tố phiên mã được làm giàu nhiều nhất trong các sợi cơ nhanh (Hình 4E). Ngược lại, ZSCAN30 và EPAS1 (còn được gọi là HIF2A) là những yếu tố phiên mã được làm giàu nhiều nhất trong các sợi cơ chậm (Hình 4E). Phù hợp với điều này, MAFA được biểu hiện ở mức cao hơn trong vùng UMAP tương ứng với các sợi cơ nhanh, trong khi EPAS1 có mô hình biểu hiện ngược lại (Hình 4F).
Ngoài các gen mã hóa protein đã biết, còn có rất nhiều loại RNA không mã hóa có thể tham gia vào việc điều hòa sự phát triển và bệnh tật của con người. 51, 52 Trong các bộ dữ liệu transcriptome, một số RNA không mã hóa thể hiện tính đặc hiệu theo loại sợi (Hình 5A và Bộ dữ liệu bổ sung 15), bao gồm LINC01405, có tính đặc hiệu cao đối với các sợi chậm và được báo cáo là giảm ở cơ của bệnh nhân mắc bệnh cơ ty thể. 53 Ngược lại, RP11-255P5.3, tương ứng với gen lnc-ERCC5-5 (https://lncipedia.org/db/transcript/lnc-ERCC5-5:2) 54, thể hiện tính đặc hiệu theo loại sợi nhanh. Cả LINC01405 (https://tinyurl.com/x5k9wj3h) và RP11-255P5.3 (https://tinyurl.com/29jmzder) đều thể hiện tính đặc hiệu đối với cơ xương (Hình bổ sung 9A–B) và không có gen co cơ nào được biết đến trong vùng lân cận bộ gen 1 Mb của chúng, cho thấy chúng đóng vai trò chuyên biệt trong việc điều chỉnh các loại sợi cơ hơn là điều chỉnh các gen co cơ lân cận. Hồ sơ biểu hiện đặc hiệu theo loại sợi cơ chậm/nhanh của LINC01405 và RP11-255P5.3 đã được xác nhận bằng RNAscope (Hình 5B–C).
A. Các bản sao RNA không mã hóa được điều chỉnh đáng kể trong các sợi cơ co chậm và co nhanh. B. Hình ảnh RNAscope tiêu biểu cho thấy tính đặc hiệu loại sợi cơ co chậm và co nhanh của LINC01405 và RP11-255P5.3, tương ứng. Thanh tỷ lệ = 50 μm. C. Định lượng biểu hiện RNA không mã hóa đặc hiệu loại sợi cơ được xác định bằng RNAscope (n = 3 mẫu sinh thiết từ các cá thể độc lập, so sánh các sợi cơ co nhanh và co chậm trong mỗi cá thể). Phân tích thống kê được thực hiện bằng phép thử t Student hai phía. Biểu đồ hộp hiển thị giá trị trung vị và tứ phân vị thứ nhất và thứ ba, với các đường râu chỉ vào giá trị tối thiểu và tối đa. D. Quy trình xác định protein vi sinh vật de novo (được tạo bằng BioRender.com). E. Protein vi sinh vật LINC01405_ORF408:17441:17358 được biểu hiện đặc hiệu trong các sợi cơ xương co chậm (n=5 mẫu sinh thiết từ những người tham gia độc lập, so sánh các sợi cơ co nhanh và co chậm trong mỗi người tham gia). Phân tích thống kê được thực hiện bằng phương pháp mô hình tuyến tính Limm kết hợp với phương pháp Bayes thực nghiệm, tiếp theo là phương pháp Benjamini-Hochberg để so sánh đa cặp với điều chỉnh giá trị p. Biểu đồ hộp thể hiện giá trị trung vị, tứ phân vị thứ nhất và thứ ba, với các đường râu chỉ vào giá trị tối đa/tối thiểu.
Gần đây, các nghiên cứu đã chỉ ra rằng nhiều bản sao không mã hóa được cho là mã hóa các protein vi khuẩn được phiên mã, một số trong đó điều chỉnh chức năng cơ. 44, 55 Để xác định các protein vi khuẩn có khả năng đặc hiệu theo loại sợi cơ, chúng tôi đã tìm kiếm trong tập dữ liệu proteome 1000 sợi cơ của mình bằng cách sử dụng tệp FASTA tùy chỉnh chứa trình tự của các bản sao không mã hóa (n = 305) được tìm thấy trong tập dữ liệu transcriptome 1000 sợi cơ (Hình 5D). Chúng tôi đã xác định được 197 protein vi khuẩn từ 22 bản sao khác nhau, trong đó 71 protein được điều chỉnh khác nhau giữa các sợi cơ xương chậm và nhanh (Hình bổ sung 9C và Tập dữ liệu bổ sung 16). Đối với LINC01405, ba sản phẩm protein vi khuẩn đã được xác định, một trong số đó cho thấy tính đặc hiệu sợi chậm tương tự như bản sao của nó (Hình 5E và Hình bổ sung 9D). Do đó, chúng tôi đã xác định LINC01405 là một gen mã hóa protein vi khuẩn đặc hiệu cho các sợi cơ xương chậm.
Chúng tôi đã phát triển một quy trình làm việc toàn diện để đặc trưng hóa protein quy mô lớn của từng sợi cơ riêng lẻ và xác định các yếu tố điều hòa tính không đồng nhất của sợi cơ ở trạng thái khỏe mạnh. Chúng tôi đã áp dụng quy trình này để hiểu cách bệnh loạn dưỡng cơ dạng sợi nemaline ảnh hưởng đến tính không đồng nhất của sợi cơ xương. Bệnh loạn dưỡng cơ dạng sợi nemaline là bệnh cơ di truyền gây yếu cơ và ở trẻ em mắc bệnh, có nhiều biến chứng bao gồm suy hô hấp, vẹo cột sống và hạn chế vận động chi. 19,20 Thông thường, trong bệnh loạn dưỡng cơ dạng sợi nemaline, các biến thể gây bệnh trong các gen như actin alpha 1 (ACTA1) dẫn đến sự chiếm ưu thế của thành phần sợi cơ co chậm, mặc dù hiệu ứng này không đồng nhất. Một ngoại lệ đáng chú ý là bệnh loạn dưỡng cơ dạng sợi nemaline troponin T1 (TNNT1), có sự chiếm ưu thế của các sợi cơ co nhanh. Do đó, hiểu rõ hơn về tính không đồng nhất tiềm ẩn trong sự rối loạn điều hòa sợi cơ xương được quan sát thấy trong bệnh loạn dưỡng cơ dạng sợi nemaline có thể giúp làm sáng tỏ mối quan hệ phức tạp giữa các bệnh này và loại sợi cơ.
So với nhóm đối chứng khỏe mạnh (n=3 mỗi nhóm), các sợi cơ được phân lập từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline có đột biến gen ACTA1 và TNNT1 cho thấy sự teo hoặc loạn dưỡng sợi cơ rõ rệt (Hình 6A, Bảng bổ sung 3). Điều này đặt ra những thách thức kỹ thuật đáng kể đối với phân tích proteomics do lượng vật liệu có sẵn bị hạn chế. Mặc dù vậy, chúng tôi đã có thể phát hiện 2485 protein trong 272 sợi cơ xương. Sau khi lọc ra ít nhất 1000 protein được định lượng trên mỗi sợi, 250 sợi đã được đưa vào phân tích tin sinh học tiếp theo. Sau khi lọc, trung bình 1573 ± 359 protein trên mỗi sợi đã được định lượng (Hình bổ sung 10A, Bộ dữ liệu bổ sung 17–18). Đáng chú ý, mặc dù kích thước sợi giảm đáng kể, độ sâu proteome của các mẫu bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline chỉ giảm ở mức độ vừa phải. Hơn nữa, việc xử lý dữ liệu này bằng các tệp FASTA của riêng chúng tôi (bao gồm cả các bản sao không mã hóa) cho phép chúng tôi xác định được năm protein vi khuẩn trong các sợi cơ xương từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi (Bộ dữ liệu bổ sung 19). Phạm vi động của hệ protein rộng hơn đáng kể, và tổng số protein trong nhóm đối chứng tương quan tốt với kết quả của phân tích hệ protein 1000 sợi trước đó (Hình bổ sung 10B–C).
A. Hình ảnh hiển vi cho thấy sự teo hoặc loạn dưỡng sợi cơ và sự chiếm ưu thế của các loại sợi cơ khác nhau dựa trên MYH trong bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1 (NM). Thanh tỷ lệ = 100 μm. Để đảm bảo tính khả reproducible của quá trình nhuộm ở bệnh nhân ACTA1 và TNNT1, ba mẫu sinh thiết của bệnh nhân đã được nhuộm hai đến ba lần (bốn lát cắt mỗi trường hợp) trước khi chọn hình ảnh đại diện. B. Tỷ lệ các loại sợi cơ ở người tham gia dựa trên MYH. C. Biểu đồ phân tích thành phần chính (PCA) của các sợi cơ xương ở bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi và nhóm đối chứng. D. Các sợi cơ xương từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi và nhóm đối chứng được chiếu lên biểu đồ PCA được xác định từ 1000 sợi được phân tích trong Hình 2. Ví dụ, biểu đồ núi lửa so sánh sự khác biệt giữa những người tham gia mắc bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1 và nhóm đối chứng, và giữa những người tham gia mắc bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1. Các vòng tròn màu biểu thị các protein có sự khác biệt đáng kể ở mức π < 0,05, và các chấm đen biểu thị các protein có sự khác biệt đáng kể ở mức FDR < 0,05. Phân tích thống kê được thực hiện bằng phương pháp mô hình tuyến tính Limma và các phương pháp Bayes thực nghiệm, tiếp theo là điều chỉnh giá trị p cho nhiều phép so sánh bằng phương pháp Benjamini-Hochberg. H. Phân tích làm giàu các protein biểu hiện khác biệt đáng kể trên toàn bộ hệ protein và trong các sợi loại 1 và 2A. Phân tích thống kê được thực hiện bằng gói clusterProfiler và giá trị p được điều chỉnh theo phương pháp Benjamini-Hochberg. I, J. Biểu đồ phân tích thành phần chính (PCA) được tô màu theo các thuật ngữ phân loại gen (GO) của chất nền ngoại bào và ty thể.
Vì bệnh loạn dưỡng cơ dạng sợi nemaline có thể ảnh hưởng đến tỷ lệ các loại sợi cơ biểu hiện MYH trong cơ xương,19,20 nên trước tiên chúng tôi đã kiểm tra các loại sợi cơ biểu hiện MYH ở bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline và nhóm đối chứng. Chúng tôi đã xác định loại sợi cơ bằng phương pháp không thiên vị đã được mô tả trước đây cho xét nghiệm 1000 sợi cơ (Hình bổ sung 10D–E) và một lần nữa không xác định được các sợi cơ 2X thuần túy (Hình 6B). Chúng tôi quan sát thấy tác động không đồng nhất của bệnh loạn dưỡng cơ dạng sợi nemaline lên loại sợi cơ, vì hai bệnh nhân có đột biến ACTA1 có tỷ lệ sợi cơ loại 1 tăng lên, trong khi hai bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline TNNT1 có tỷ lệ sợi cơ loại 1 giảm xuống (Hình 6B). Thật vậy, sự biểu hiện của MYH2 và các dạng đồng phân troponin nhanh (TNNC2, TNNI2 và TNNT3) đã giảm ở bệnh loạn dưỡng cơ dạng sợi nemaline ACTA1, trong khi sự biểu hiện của MYH7 giảm ở bệnh loạn dưỡng cơ dạng sợi nemaline TNNT1 (Hình bổ sung 11A). Điều này phù hợp với các báo cáo trước đây về sự chuyển đổi loại sợi cơ không đồng nhất trong bệnh loạn dưỡng cơ dạng sợi nemaline.19,20 Chúng tôi đã xác nhận những kết quả này bằng phương pháp hóa mô miễn dịch và nhận thấy rằng bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline ACTA1 có sự chiếm ưu thế của các sợi cơ loại 1, trong khi bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline TNNT1 có kiểu hình ngược lại (Hình 6A).
Ở cấp độ protein sợi đơn, các sợi cơ xương từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1 tập trung cùng với phần lớn các sợi cơ đối chứng, trong đó các sợi cơ mắc bệnh loạn dưỡng cơ dạng sợi TNNT1 thường bị ảnh hưởng nặng nhất (Hình 6C). Điều này đặc biệt rõ ràng khi vẽ biểu đồ phân tích thành phần chính (PCA) của các sợi cơ giả phồng cho mỗi bệnh nhân, với bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi TNNT1 số 2 và 3 có vẻ xa nhất so với các mẫu đối chứng (Hình bổ sung 11B, Bộ dữ liệu bổ sung 20). Để hiểu rõ hơn về sự so sánh giữa các sợi cơ từ bệnh nhân mắc bệnh loạn dưỡng cơ với các sợi cơ khỏe mạnh, chúng tôi đã sử dụng thông tin chi tiết thu được từ phân tích protein của 1.000 sợi cơ từ những người tham gia trưởng thành khỏe mạnh. Chúng tôi đã chiếu các sợi cơ từ tập dữ liệu bệnh loạn dưỡng cơ (bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1 và nhóm đối chứng) lên biểu đồ PCA thu được từ phân tích protein 1000 sợi (Hình 6D). Sự phân bố các loại sợi MYH dọc theo PC2 trong các sợi cơ đối chứng tương tự như sự phân bố sợi thu được từ phân tích protein 1000 sợi. Tuy nhiên, hầu hết các sợi cơ ở bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline đều dịch chuyển xuống PC2, trùng lặp với các sợi cơ co nhanh khỏe mạnh, bất kể loại sợi MYH tự nhiên của chúng là gì. Do đó, mặc dù bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline ACTA1 cho thấy sự dịch chuyển về phía các sợi loại 1 khi được định lượng bằng các phương pháp dựa trên MYH, cả bệnh loạn dưỡng cơ dạng sợi nemaline ACTA1 và TNNT1 đều làm dịch chuyển proteome sợi cơ xương về phía các sợi cơ co nhanh.
Sau đó, chúng tôi so sánh trực tiếp từng nhóm bệnh nhân với nhóm đối chứng khỏe mạnh và xác định được 256 và 552 protein biểu hiện khác biệt trong bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1 tương ứng (Hình 6E–G và Hình bổ sung 11C, Bộ dữ liệu bổ sung 21). Phân tích làm giàu gen cho thấy sự giảm đồng bộ của các protein ty thể (Hình 6H–I, Bộ dữ liệu bổ sung 22). Điều đáng ngạc nhiên là, mặc dù có sự chiếm ưu thế khác nhau của các loại sợi trong bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1, sự giảm này hoàn toàn độc lập với loại sợi dựa trên MYH (Hình 6H và Hình bổ sung 11D–I, Bộ dữ liệu bổ sung 23). Ba protein vi khuẩn cũng được điều chỉnh trong bệnh loạn dưỡng cơ dạng sợi ACTA1 hoặc TNNT1. Hai trong số các vi protein này, ENSG00000215483_TR14_ORF67 (còn được gọi là LINC00598 hoặc Lnc-FOXO1) và ENSG00000229425_TR25_ORF40 (lnc-NRIP1-2), chỉ thể hiện sự khác biệt về hàm lượng ở các sợi cơ loại 1. ENSG00000215483_TR14_ORF67 trước đây đã được báo cáo là đóng vai trò trong điều hòa chu kỳ tế bào. 56 Mặt khác, ENSG00000232046_TR1_ORF437 (tương ứng với LINC01798) tăng lên ở cả sợi cơ loại 1 và loại 2A trong bệnh loạn dưỡng cơ ACTA1-nemaline so với nhóm đối chứng khỏe mạnh (Hình bổ sung 12A, Bộ dữ liệu bổ sung 24). Ngược lại, các protein ribosome hầu như không bị ảnh hưởng bởi bệnh loạn dưỡng cơ dạng sợi nemaline, mặc dù RPS17 bị giảm biểu hiện trong bệnh loạn dưỡng cơ dạng sợi nemaline ACTA1 (Hình 6E).
Phân tích làm giàu cũng cho thấy sự tăng cường các quá trình của hệ thống miễn dịch trong bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1, trong khi sự bám dính tế bào cũng tăng lên trong bệnh loạn dưỡng cơ dạng sợi TNNT1 (Hình 6H). Sự làm giàu của các yếu tố ngoại bào này được phản ánh bởi các protein ma trận ngoại bào làm dịch chuyển PCA trong PC1 và PC2 theo hướng âm (tức là hướng về phía các sợi bị ảnh hưởng nhiều nhất) (Hình 6J). Cả hai nhóm bệnh nhân đều cho thấy sự tăng biểu hiện của các protein ngoại bào liên quan đến phản ứng miễn dịch và cơ chế sửa chữa màng tế bào cơ, chẳng hạn như annexin (ANXA1, ANXA2, ANXA5)57,58 và protein tương tác của chúng S100A1159 (Hình bổ sung 12B–C). Quá trình này trước đây đã được báo cáo là tăng cường trong bệnh loạn dưỡng cơ60 nhưng theo hiểu biết của chúng tôi, chưa từng được liên kết với bệnh loạn dưỡng cơ dạng sợi. Chức năng bình thường của bộ máy phân tử này là cần thiết cho việc sửa chữa màng tế bào cơ sau chấn thương và cho sự hợp nhất của các tế bào cơ mới hình thành với các sợi cơ58,61. Như vậy, sự gia tăng hoạt động của quá trình này ở cả hai nhóm bệnh nhân cho thấy một phản ứng phục hồi đối với tổn thương do sự mất ổn định của sợi cơ gây ra.
Tác động của từng loại bệnh cơ dạng sợi nemaline đều tương quan tốt (r = 0,736) và cho thấy sự chồng chéo hợp lý (Hình bổ sung 11A–B), cho thấy bệnh cơ dạng sợi nemaline ACTA1 và TNNT1 có tác động tương tự lên hệ protein. Tuy nhiên, một số protein chỉ được điều chỉnh trong bệnh cơ dạng sợi nemaline ACTA1 hoặc TNNT1 (Hình bổ sung 11A và C). Protein gây xơ hóa MFAP4 là một trong những protein được điều chỉnh tăng cao nhất trong bệnh cơ dạng sợi nemaline TNNT1 nhưng không thay đổi trong bệnh cơ dạng sợi nemaline ACTA1. SKIC8, một thành phần của phức hợp PAF1C chịu trách nhiệm điều chỉnh quá trình phiên mã gen HOX, bị điều chỉnh giảm trong bệnh cơ dạng sợi nemaline TNNT1 nhưng không bị ảnh hưởng trong bệnh cơ dạng sợi nemaline ACTA1 (Hình bổ sung 11A). So sánh trực tiếp bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1 cho thấy sự giảm mạnh hơn về protein ty thể và tăng protein hệ thống miễn dịch ở bệnh loạn dưỡng cơ dạng sợi TNNT1 (Hình 6G–H và Hình bổ sung 11C và 11H–I). Dữ liệu này phù hợp với tình trạng teo/loạn dưỡng nặng hơn được quan sát thấy ở bệnh loạn dưỡng cơ dạng sợi TNNT1 so với bệnh loạn dưỡng cơ dạng sợi TNNT1 (Hình 6A), cho thấy bệnh loạn dưỡng cơ dạng sợi TNNT1 là một dạng bệnh nặng hơn.
Để đánh giá xem các tác động quan sát được của bệnh loạn dưỡng cơ dạng sợi nemaline có còn tồn tại ở cấp độ toàn bộ cơ hay không, chúng tôi đã thực hiện phân tích proteomics tổng thể trên các mẫu sinh thiết cơ từ cùng một nhóm bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline TNNT1 và so sánh chúng với nhóm đối chứng (n=3 mỗi nhóm) (Hình bổ sung 13A, Bộ dữ liệu bổ sung 25). Như dự đoán, nhóm đối chứng có mối liên hệ chặt chẽ trong phân tích thành phần chính, trong khi bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline TNNT1 cho thấy sự biến thiên giữa các mẫu cao hơn, tương tự như sự biến thiên được thấy trong phân tích sợi đơn (Hình bổ sung 13B). Phân tích tổng thể đã tái tạo được các protein biểu hiện khác biệt (Hình bổ sung 13C, Bộ dữ liệu bổ sung 26) và các quá trình sinh học (Hình bổ sung 13D, Bộ dữ liệu bổ sung 27) được làm nổi bật bằng cách so sánh các sợi riêng lẻ, nhưng lại mất khả năng phân biệt giữa các loại sợi khác nhau và không thể giải thích được các tác động bệnh lý không đồng nhất trên các sợi.
Tóm lại, những dữ liệu này chứng minh rằng phân tích protein trên từng sợi cơ riêng lẻ có thể làm sáng tỏ các đặc điểm sinh học lâm sàng mà các phương pháp nhắm mục tiêu như immunoblotting không thể phát hiện được. Hơn nữa, những dữ liệu này nhấn mạnh những hạn chế của việc chỉ sử dụng phân loại sợi actin (MYH) để mô tả sự thích nghi kiểu hình. Thật vậy, mặc dù sự chuyển đổi loại sợi khác nhau giữa bệnh loạn dưỡng cơ dạng sợi actin và troponin, cả hai bệnh loạn dưỡng cơ dạng sợi này đều tách rời việc phân loại sợi MYH khỏi quá trình chuyển hóa sợi cơ xương, dẫn đến một hệ protein cơ nhanh hơn và ít oxy hóa hơn.
Tính không đồng nhất của tế bào rất quan trọng để các mô đáp ứng được nhu cầu đa dạng của chúng. Trong cơ xương, điều này thường được mô tả là các loại sợi cơ có đặc điểm khác nhau về khả năng tạo lực và độ mỏi. Tuy nhiên, rõ ràng là điều này chỉ giải thích một phần nhỏ sự biến đổi của sợi cơ xương, vốn phức tạp, đa diện và đa dạng hơn nhiều so với suy nghĩ trước đây. Những tiến bộ công nghệ hiện nay đã làm sáng tỏ các yếu tố điều chỉnh sợi cơ xương. Thật vậy, dữ liệu của chúng tôi cho thấy rằng sợi loại 2X có thể không phải là một phân nhóm sợi cơ xương riêng biệt. Hơn nữa, chúng tôi đã xác định các protein chuyển hóa, protein ribosome và protein liên kết tế bào là những yếu tố quyết định chính đến tính không đồng nhất của sợi cơ xương. Bằng cách áp dụng quy trình phân tích protein của chúng tôi vào các mẫu bệnh nhân mắc bệnh cơ do giun tròn, chúng tôi đã chứng minh thêm rằng việc phân loại sợi dựa trên MYH không phản ánh đầy đủ tính không đồng nhất của cơ xương, đặc biệt khi hệ thống bị rối loạn. Thật vậy, bất kể loại sợi dựa trên MYH nào, bệnh cơ do giun tròn đều dẫn đến sự chuyển dịch sang các sợi nhanh hơn và ít oxy hóa hơn.
Các sợi cơ xương đã được phân loại từ thế kỷ 19. Các phân tích omics gần đây đã cho phép chúng ta bắt đầu hiểu được hồ sơ biểu hiện của các loại sợi MYH khác nhau và phản ứng của chúng với các kích thích khác nhau. Như đã mô tả ở đây, các phương pháp omics cũng có lợi thế là độ nhạy cao hơn trong việc định lượng các dấu ấn loại sợi so với các phương pháp dựa trên kháng thể truyền thống, mà không cần dựa vào việc định lượng một (hoặc một vài) dấu ấn để xác định loại sợi cơ xương. Chúng tôi đã sử dụng các quy trình phân tích transcriptome và proteome bổ sung và tích hợp các kết quả để kiểm tra sự điều hòa phiên mã và hậu phiên mã của tính không đồng nhất của sợi trong các sợi cơ xương người. Quy trình này dẫn đến việc không xác định được các sợi loại 2X thuần túy ở cấp độ protein trong cơ vastus lateralis của nhóm nam giới trẻ khỏe mạnh trong nghiên cứu của chúng tôi. Điều này phù hợp với các nghiên cứu về sợi đơn trước đây cho thấy có <1% sợi 2X thuần túy trong cơ vastus lateralis khỏe mạnh, mặc dù điều này cần được xác nhận ở các cơ khác trong tương lai. Sự khác biệt giữa việc phát hiện các sợi 2X gần như thuần túy ở cấp độ mRNA và chỉ có các sợi 2A/2X hỗn hợp ở cấp độ protein là điều khó hiểu. Biểu hiện mRNA của các dạng MYH không theo chu kỳ sinh học ngày đêm,67 cho thấy chúng ta khó có thể “bỏ sót” tín hiệu khởi phát MYH2 trong các sợi 2X dường như thuần khiết ở cấp độ RNA. Một lời giải thích khả thi, mặc dù hoàn toàn mang tính giả thuyết, có thể là sự khác biệt về độ ổn định của protein và/hoặc mRNA giữa các dạng MYH. Thật vậy, không có sợi cơ nhanh nào thuần khiết 100% đối với bất kỳ dạng MYH nào, và không rõ liệu mức độ biểu hiện mRNA MYH1 trong khoảng 70–90% có dẫn đến sự phong phú tương đương của MYH1 và MYH2 ở cấp độ protein hay không. Tuy nhiên, khi xem xét toàn bộ transcriptome hoặc proteome, phân tích cụm có thể tự tin xác định chỉ hai cụm riêng biệt đại diện cho các sợi cơ xương chậm và nhanh, bất kể thành phần MYH chính xác của chúng. Điều này phù hợp với các phân tích sử dụng phương pháp transcriptome đơn nhân, thường chỉ xác định hai cụm nhân cơ riêng biệt. 68, 69, 70 Hơn nữa, mặc dù các nghiên cứu proteomics trước đây đã xác định các sợi loại 2X, nhưng các sợi này không phân nhóm riêng biệt với phần còn lại của các sợi nhanh và chỉ cho thấy một số lượng nhỏ các protein có mức độ phong phú khác biệt so với các loại sợi khác dựa trên MYH. 14 Những kết quả này cho thấy chúng ta nên quay lại quan điểm phân loại sợi cơ từ đầu thế kỷ 20, trong đó các sợi cơ xương của con người không được chia thành ba lớp riêng biệt dựa trên MYH, mà thành hai nhóm dựa trên các đặc tính chuyển hóa và co bóp của chúng. 63
Quan trọng hơn, tính không đồng nhất của sợi cơ cần được xem xét trên nhiều khía cạnh. Các nghiên cứu “omics” trước đây đã chỉ ra hướng này, cho thấy các sợi cơ xương không tạo thành các cụm riêng biệt mà được sắp xếp dọc theo một chuỗi liên tục. 11, 13, 14, 64, 71 Ở đây, chúng tôi chỉ ra rằng, ngoài sự khác biệt về đặc tính co bóp và chuyển hóa của cơ xương, các sợi cơ có thể được phân biệt bởi các đặc điểm liên quan đến tương tác giữa các tế bào và cơ chế dịch mã. Thật vậy, chúng tôi đã tìm thấy sự không đồng nhất của ribosome trong các sợi cơ xương góp phần tạo nên tính không đồng nhất độc lập với loại sợi chậm và nhanh. Nguyên nhân cơ bản của sự không đồng nhất đáng kể của sợi cơ này, độc lập với loại sợi chậm và nhanh, vẫn chưa rõ ràng, nhưng nó có thể chỉ ra sự tổ chức không gian chuyên biệt bên trong các bó cơ đáp ứng tối ưu với các lực và tải trọng cụ thể,72 sự giao tiếp chuyên biệt giữa tế bào hoặc cơ quan với các loại tế bào khác trong môi trường vi mô của cơ73,74,75 hoặc sự khác biệt trong hoạt động của ribosome bên trong từng sợi cơ riêng lẻ. Thật vậy, hiện tượng dị hợp tử ribosome, thông qua sự thay thế tương đồng của RPL3 và RPL3L hoặc ở mức độ methyl hóa 2′O của rRNA, đã được chứng minh là có liên quan đến sự phì đại cơ xương76,77. Các ứng dụng đaomics và không gian kết hợp với đặc điểm chức năng của từng sợi cơ sẽ giúp chúng ta hiểu rõ hơn về sinh học cơ ở cấp độ đaomics78.
Bằng cách phân tích proteome của từng sợi cơ riêng lẻ từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi nemaline, chúng tôi cũng đã chứng minh tính hữu ích, hiệu quả và khả năng ứng dụng của proteomics từng sợi cơ riêng lẻ để làm sáng tỏ sinh lý bệnh lâm sàng của cơ xương. Hơn nữa, bằng cách so sánh quy trình làm việc của chúng tôi với phân tích proteomics toàn cầu, chúng tôi đã chứng minh rằng proteomics từng sợi cơ riêng lẻ mang lại độ sâu thông tin tương đương với proteomics mô toàn cầu và mở rộng độ sâu này bằng cách tính đến sự không đồng nhất giữa các sợi và loại sợi cơ. Ngoài những khác biệt dự kiến (mặc dù có thể thay đổi) về tỷ lệ loại sợi được quan sát thấy ở bệnh loạn dưỡng cơ dạng sợi nemaline ACTA1 và TNNT1 so với nhóm đối chứng khỏe mạnh,19 chúng tôi cũng quan sát thấy sự tái cấu trúc oxy hóa và ngoại bào độc lập với sự chuyển đổi loại sợi do MYH điều hòa. Trước đây, tình trạng xơ hóa đã được báo cáo ở bệnh loạn dưỡng cơ dạng sợi TNNT1.19 Tuy nhiên, phân tích của chúng tôi dựa trên phát hiện này bằng cách tiết lộ thêm mức độ gia tăng của các protein liên quan đến stress được tiết ra từ bên ngoài tế bào, chẳng hạn như annexin, tham gia vào các cơ chế sửa chữa màng tế bào cơ, trong các sợi cơ từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi ACTA1 và TNNT1.57,58,59 Tóm lại, mức độ annexin gia tăng trong các sợi cơ từ bệnh nhân mắc bệnh loạn dưỡng cơ dạng sợi có thể đại diện cho phản ứng tế bào nhằm sửa chữa các sợi cơ bị teo nghiêm trọng.
Mặc dù nghiên cứu này đại diện cho phân tích omics toàn bộ cơ đơn sợi lớn nhất ở người cho đến nay, nó vẫn có những hạn chế. Chúng tôi đã phân lập các sợi cơ xương từ một mẫu người tham gia tương đối nhỏ và đồng nhất, từ một cơ duy nhất (cơ vastus lateralis). Do đó, không thể loại trừ sự tồn tại của các quần thể sợi cụ thể trên các loại cơ và ở các trạng thái sinh lý cơ cực đoan. Ví dụ, chúng tôi không thể loại trừ khả năng xuất hiện một tập hợp con các sợi siêu nhanh (ví dụ: sợi 2X thuần túy) ở những vận động viên chạy nước rút và/hoặc vận động viên sức mạnh được đào tạo chuyên sâu79 hoặc trong thời kỳ không hoạt động cơ bắp66,80. Hơn nữa, kích thước mẫu hạn chế của người tham gia đã ngăn cản chúng tôi điều tra sự khác biệt về giới tính trong tính không đồng nhất của sợi, vì tỷ lệ các loại sợi được biết là khác nhau giữa nam và nữ. Ngoài ra, chúng tôi không thể tiến hành phân tích transcriptome và proteome trên cùng một sợi cơ hoặc mẫu từ cùng một người tham gia. Khi chúng tôi và những người khác tiếp tục tối ưu hóa phân tích tế bào đơn lẻ và sợi cơ đơn lẻ bằng cách sử dụng phân tích omics để đạt được lượng mẫu đầu vào cực thấp (như đã được chứng minh ở đây trong phân tích các sợi cơ từ bệnh nhân mắc bệnh cơ ty thể), cơ hội kết hợp các phương pháp đa omics (và chức năng) trong từng sợi cơ riêng lẻ trở nên rõ ràng hơn.
Nhìn chung, dữ liệu của chúng tôi xác định và giải thích các yếu tố phiên mã và hậu phiên mã thúc đẩy sự đa dạng của cơ xương. Cụ thể, chúng tôi trình bày dữ liệu thách thức một quan niệm lâu đời trong sinh lý học cơ xương liên quan đến định nghĩa cổ điển về các loại sợi cơ dựa trên MYH. Chúng tôi hy vọng sẽ khơi lại cuộc tranh luận và cuối cùng là xem xét lại sự hiểu biết của chúng ta về phân loại và sự đa dạng của các sợi cơ xương.
Mười bốn người tham gia thuộc chủng tộc da trắng (12 nam và 2 nữ) đã tự nguyện đồng ý tham gia nghiên cứu này. Nghiên cứu đã được Ủy ban Đạo đức của Bệnh viện Đại học Ghent phê duyệt (BC-10237), tuân thủ Tuyên bố Helsinki năm 2013 và được đăng ký tại ClinicalTrials.gov (NCT05131555). Đặc điểm chung của những người tham gia được trình bày trong Bảng bổ sung 1. Sau khi nhận được sự đồng ý bằng lời nói và bằng văn bản, những người tham gia đã trải qua một cuộc kiểm tra y tế trước khi được đưa vào nghiên cứu chính thức. Những người tham gia đều trẻ (22–42 tuổi), khỏe mạnh (không mắc bệnh lý, không có tiền sử hút thuốc) và hoạt động thể chất ở mức độ vừa phải. Khả năng hấp thụ oxy tối đa được xác định bằng cách sử dụng máy đo công suất bước để đánh giá thể lực như đã mô tả trước đây. 81
Các mẫu sinh thiết cơ được thu thập ở trạng thái nghỉ ngơi và nhịn ăn ba lần, cách nhau 14 ngày. Vì các mẫu này được thu thập như một phần của nghiên cứu lớn hơn, những người tham gia đã dùng giả dược (lactose), thuốc đối kháng thụ thể H1 (540 mg fexofenadine) hoặc thuốc đối kháng thụ thể H2 (40 mg famotidine) 40 phút trước khi sinh thiết. Chúng tôi đã chứng minh trước đây rằng các thuốc đối kháng thụ thể histamine này không ảnh hưởng đến thể lực cơ xương khi nghỉ ngơi81, và không quan sát thấy sự phân cụm liên quan đến trạng thái trong biểu đồ kiểm soát chất lượng của chúng tôi (Hình bổ sung 3 và 6). Chế độ ăn tiêu chuẩn (41,4 kcal/kg trọng lượng cơ thể, 5,1 g/kg trọng lượng cơ thể carbohydrate, 1,4 g/kg trọng lượng cơ thể protein và 1,6 g/kg trọng lượng cơ thể chất béo) được duy trì trong 48 giờ trước mỗi ngày thí nghiệm, và bữa sáng tiêu chuẩn (1,5 g/kg trọng lượng cơ thể carbohydrate) được dùng vào buổi sáng của ngày thí nghiệm. Dưới gây tê tại chỗ (0,5 ml lidocaine 1% không có epinephrine), các mẫu sinh thiết cơ được lấy từ cơ vastus lateralis bằng phương pháp hút Bergström qua da.82 Các mẫu cơ được nhúng ngay vào RNAlater và bảo quản ở 4°C cho đến khi phân tách sợi cơ bằng tay (tối đa 3 ngày).
Các bó sợi cơ mới được phân lập được chuyển vào môi trường RNAlater tươi trong đĩa nuôi cấy. Sau đó, các sợi cơ riêng lẻ được tách thủ công bằng kính hiển vi soi nổi và nhíp nhỏ. Hai mươi lăm sợi được tách ra từ mỗi mẫu sinh thiết, đặc biệt chú ý đến việc chọn các sợi từ các vùng khác nhau của mẫu sinh thiết. Sau khi tách, mỗi sợi được nhẹ nhàng nhúng vào 3 μl dung dịch đệm ly giải (Bộ dụng cụ ly giải tế bào SingleShot, Bio-Rad) chứa các enzyme proteinase K và DNase để loại bỏ các protein và DNA không mong muốn. Quá trình ly giải tế bào và loại bỏ protein/DNA sau đó được bắt đầu bằng cách lắc nhẹ, quay ly tâm dung dịch trong máy ly tâm siêu nhỏ và ủ ở nhiệt độ phòng (10 phút). Dịch ly giải sau đó được ủ trong máy chu trình nhiệt (T100, Bio-Rad) ở 37°C trong 5 phút, 75°C trong 5 phút, và sau đó được bảo quản ngay lập tức ở -80°C cho đến khi xử lý tiếp.
Các thư viện RNA polyadenylated tương thích với Illumina được chuẩn bị từ 2 µl dịch chiết sợi cơ bằng cách sử dụng bộ kit QuantSeq-Pool 3′ mRNA-Seq Library Prep Kit (Lexogen). Phương pháp chi tiết có thể được tìm thấy trong hướng dẫn sử dụng của nhà sản xuất. Quá trình bắt đầu bằng việc tổng hợp cDNA sợi đầu tiên bằng phương pháp phiên mã ngược, trong đó các mã định danh phân tử duy nhất (UMI) và mã vạch i1 đặc hiệu cho từng mẫu được đưa vào để đảm bảo việc gộp mẫu và giảm sự biến đổi kỹ thuật trong quá trình xử lý tiếp theo. cDNA từ 96 sợi cơ sau đó được gộp lại và tinh sạch bằng hạt từ tính, sau đó RNA được loại bỏ và quá trình tổng hợp sợi thứ hai được thực hiện bằng cách sử dụng mồi ngẫu nhiên. Thư viện được tinh sạch bằng hạt từ tính, các thẻ i5/i7 đặc hiệu cho từng nhóm được thêm vào và khuếch đại bằng PCR. Bước tinh sạch cuối cùng tạo ra các thư viện tương thích với Illumina. Chất lượng của mỗi nhóm thư viện được đánh giá bằng bộ kit High Sensitivity Small Fragment DNA Analysis Kit (Agilent Technologies, DNF-477-0500).
Dựa trên định lượng Qubit, các mẫu được trộn tiếp ở nồng độ mol bằng nhau (2 nM). Mẫu thu được sau đó được giải trình tự trên thiết bị NovaSeq 6000 ở chế độ tiêu chuẩn bằng cách sử dụng Bộ thuốc thử NovaSeq S2 (1 × 100 nucleotide) với lượng mẫu tải 2 nM (4% PhiX).
Quy trình xử lý dữ liệu của chúng tôi dựa trên quy trình phân tích dữ liệu QuantSeq Pool của Lexogen (https://github.com/Lexogen-Tools/quantseqpool_analysis). Dữ liệu được tách ghép đầu tiên bằng bcl2fastq2 (v2.20.0) dựa trên chỉ mục i7/i5. Sau đó, Read 2 được tách ghép bằng idemux (v0.1.6) dựa trên mã vạch mẫu i1 và trình tự UMI được trích xuất bằng umi_tools (v1.0.1). Các đoạn đọc sau đó được cắt tỉa bằng cutadapt (v3.4) trong nhiều vòng để loại bỏ các đoạn đọc ngắn (<20) hoặc các đoạn đọc chỉ bao gồm trình tự adapter. Sau đó, các đoạn đọc được căn chỉnh với bộ gen người bằng STAR (v2.6.0c) và các tệp BAM được lập chỉ mục bằng SAMtools (v1.11). Các đoạn đọc trùng lặp được loại bỏ bằng umi_tools (v1.0.1). Cuối cùng, việc đếm căn chỉnh được thực hiện bằng featureCounts trong Subread (v2.0.3). Việc kiểm soát chất lượng được thực hiện bằng FastQC (v0.11.9) ở một số giai đoạn trung gian của quy trình.
Tất cả các bước xử lý và trực quan hóa tin sinh học tiếp theo đều được thực hiện trong R (v4.2.3), chủ yếu sử dụng quy trình làm việc Seurat (v4.4.0). 83 Do đó, các giá trị UMI riêng lẻ và ma trận siêu dữ liệu được chuyển đổi thành các đối tượng Seurat. Các gen được biểu hiện ở ít hơn 30% tổng số sợi đã bị loại bỏ. Các mẫu chất lượng thấp đã bị loại bỏ dựa trên ngưỡng tối thiểu là 1000 giá trị UMI và 1000 gen được phát hiện. Cuối cùng, 925 sợi đã vượt qua tất cả các bước lọc kiểm soát chất lượng. Các giá trị UMI được chuẩn hóa bằng phương pháp Seurat SCTransform v2, 84 bao gồm tất cả 7418 đặc điểm được phát hiện, và sự khác biệt giữa những người tham gia đã được loại bỏ bằng phương pháp hồi quy. Tất cả siêu dữ liệu liên quan có thể được tìm thấy trong Bộ dữ liệu bổ sung 28.
Thời gian đăng bài: 10/09/2025
