تیم پژوهشی

سایت NCBI

سایت NCBI ؛ مرکز ملی اطلاعات زیست‌فناوری

فهرست مطالب

مرکز ملی اطلاعات زیست‌فناوری (به انگلیسی: National Center for Biotechnology Information) معروف به سایت “NCBI” یکی از مراکز و شاخه‌های کتابخانه ملی پزشکی ایالات متحده آمریکا است که در زیرمجموعه مؤسسه‌ی ملی سلامت”NIH” قرار دارد. مؤسسه‌ی ملی سلامت در نهایت زیر مجموعه‌ی وزارت بهداشت و خدمات انسانی ایالات متحده آمریکا است. این مرکز در پی تصویب طرح پیشنهادی سناتور کلود پپر در کنگره آمریکا شکل گرفت. مرکز ملی اطلاعات زیست‌فناوری در شهر بتزدا در ایالت مریلند قرار دارد.

 

سایت NCBI در تونل زمان

در نوامبر ۱۹۸۸ بخش جدیدی به كتابخانه پزشكی ملی آمریكا (NLM) افزوده شد تا روش‌های كامپیوتری پردازش اطلاعات جهت هدایت تحقیقات “Biomedical” ایجاد شود. این بخش مهم، مركز ملی اطلاعات زیست‌فناوری یا سایت NCBI نام گرفت. كتابخانه ملی پزشكی آمریكا در سازمان ملی بهداشت آمریكا (NIH) قرار گرفته است؛ تجربه‌های موفق این كتابخانه در ایجاد و نگهداری پایگاه‌های داده در زمینه Biomedical و به‌عنوان بخشی از NIH باعث ایجاد یك برنامه تحقیقاتی در زمینه بیولوژی مولكولی كامپیوتری، شده است.

امروزه کاربرد سایت NCBI به شکل چشمگیری افزایش یافته و به‌عنوان بزرگترین مركز تحقیقات Biomedical در دنیا شناخته شده است. انستیتوی NCBI جهت رسیدن به اهداف خود فعالیت‌های زیر را دنبال می‌كند:

۱. هدایت تحقیقاتی در زمینه مسائل اصولی Biomedical در سطح مولكولی با بهره‌گیری از روش‌های ریاضی و كامپیوتری؛

۲. همكاری با انستیتو‌های دیگر NIH، دانشگاه‌ها، صنعت و دیگر سازمان‌های دولتی؛

۳. ایجاد ارتباط‌های علمی به‌وسیله برگزار‌كردن همایش‌ها، كارگاه‌های آموزشی و سلسله سخنرانی‌ها؛

۴. برنامه‌های تحصیلاتی برای دانشجویان در زمینه‌های بیولوژی كامپیوتری توسعه و انتشار نرم‌افزار‌ها و پایگاه‌های داده مختلف.

 

آشنایی با سایت NCBI

با تکمیل پروژه‌ی ژنوم انسان، یکی از اهداف مهم بیوانفورماتیک که تحلیل توالی‌ها می‌باشد، محقق شد؛ اما در گذر زمان با پیشرفت‌هایی که در زمینه‌ی بیوانفورماتیک حاصل شد، احساس نیاز به یک پایگاه داده که تمام اطلاعات مربوط به توالی ژن‌ها و پروتئین‌ها را ذخیره و نگهداری کند، بیشتر نمایان شد. علم بیوانفورماتیک با بهره‌گیری از پایگاه‌های داده‌ی متعدد و نرم‌افزار‌های مختلف، امکان بررسی ساختار، عملکرد، تفاوت‌های توالی‌های متعدد به‌منظور مطالعات تکاملی و … را فراهم می‌کند.

تا به امروز اطلاعات مربوط به توالی‌های موجودات مختلف در پایگاه‌های داده ذخیره و برای اهداف گوناگون در اختیار محققین قرار گرفته است. همان‌طور که اشاره شد، حفظ و نگهداری انبوه اطلاعات ژنتیکی به‌منظور دسترسی سریع محققین نیازمند پایگاه داده‌های زیستی یا بانک اطلاعاتی است که یکی از این بانک‎های اطلاعاتی، سایت NCBI نام دارد.

NCBI
NCBI

 

پایگاه‌های داده‌ی سایت NCBI

به‌منظور معرفی سایت NCBI، بهتر است بدانیم که سایت NCBI مجموعه‌ای از پایگاه‌های داده‌ی مرتبط با بیوتکنولوژی و پزشکی‌زیستی را در خود جای داده و منبع مهمی برای ابزار‌ها و خدمات بیوانفورماتیک است.

از جمله پایگاه‌های داده‌ی اصلی می‌توان به “GeneBank”، “EMBL”و “DDBJ” اشاره کرد که به‌ترتیب پایگاه داده‌ی GeneBank توسط مرکز ملی اطلاعات بیوتکنولوژی آمریکا (NCBI) واقع در انستیتو ملی سلامت (NIH)، پایگاه داده‌ی EMBL توسط انستیتو بیوانفورماتیک اروپا (EBI) و پایگاه داده‌ی “DDBJ” توسط انستیتو ملی ژنتیک ژاپن اداره می‌شود. این پایگاه‌های داده به گونه‌ای طراحی شده‌اند که افزودن یا به‌روز‌کردن اطلاعات حتی توسط کاربران نیز امکان‌پذیر است؛ لذا اطلاعات یا داده‌های جدید هر ۲۴ ساعت بین این سه پایگاه داده اشتراک‌گذاری و مبادله می‌شود.

سایت NCBI
GeneBank، EMBL و DDBJ

 

۱. پایگاه داده‌ی GeneBank

GeneBank به‌عنوان جامع‌ترین پایگاه داده سایت NCBI، علاوه‌بر فراهم‌کردن مکانی برای ذخیره‌سازی اطلاعات، شامل انبوهی از مقالات علمی در زمینه‌ی زیست‌شناسی و علوم مرتبط، اطلاعات مربوط بهDNA  ژنومی، اطلاعات مربوط به “STS” ، اطلاعات مربوط به “GSS” ، اطلاعات مربوط به “EST” و … است.

سایت NCBI
GeneBank

 

۲. پایگاه داده EMBL

از پایگاه‌های داده زیر‌مجموعه سایت NCBI،  می‌توان به پایگاه داده‌ی EMBL اشاره کرد. مؤسسه بیوانفورماتیک اروپایی(EMBL-EBI) یک سازمان بین‌دولتی (IGO) است که به‌عنوان بخشی از خانواده آزمایشگاه بیولوژی مولکولی اروپا (EMBL) بر تحقیقات و خدمات در بیوانفورماتیک تمرکز دارد. این دانشگاه در پردیس ژنوم Wellcome در Hinxton در نزدیکی کمبریج واقع شده است.

سایت NCBI
EMBL

 

۳. پایگاه داده DDBJ

بانک اطلاعات DNA ژاپن (DDBJ)، یکی دیگر از پایگاه‌های زیر مجموعه سایت NCBI است. این پایگاه داده‌ی بیولوژیکی، توالی‌های DNA را جمع‌آوری می‌کند و در مؤسسه ملی ژنتیک (NIG) در استان شیزوکا ژاپن واقع شده است؛ همچنین عضوی از همکاری بین‌المللی پایگاه داده‌ی توالی نوکلئوتیدی یا”INSDC” است.

سایت NCBI
DDBJ

 

سایت NCBI دارای ابزار‌های نرم‌افزاری است که از طریق مرورگر‌های اینترنتی یا “FTP” در دسترس هستند. برای مثال، “BLAST”یک برنامه‌ی جستجوی شباهت توالی است. BLAST می‌تواند مقایسه توالی با پایگاه داده “DNA GenBank” را در کمتر از ۱۵ ثانیه انجام دهد. آسان‌ترین روش برای یافتن اطلاعات مربوط به یک ژن در پایگاه NCBI استفاده از موتور جستجوی این سایت به نام “Entrez” است. اگر به صفحه‌ی اول سایت NCBI به آدرس https://www.ncbi.nlm.nih.g بروید با موتور جستجوی Entrez روبرو خواهید شد که امکان جستجو از بین چندین منبع داده را فراهم می‌آورد. برخی از این منابع عبارتند از:

 

۱. MEDLINE

“Medical Literature Analysis and Retrieval System Online” یکی از معروف‌ترین پایگاه‌های داده‌ی سایت NCBI  است. MEDLINE یک پایگاه داده کتاب‌شناختی از علوم‌زیستی و اطلاعات زیست‌پزشکی است. این شامل اطلاعات کتاب‌شناختی برای مقالات مجلات دانشگاهی است که پزشکی، پرستاری، داروسازی، دندانپزشکی، دامپزشکی، مراقبت‌های بهداشتی، ادبیات زیست‌شناسی، تکامل مولکولی و بیوشیمی را پوشش می‌دهد.

سایت NCBI
MEDLINE

 

۲. PubMed

“PubMed ” یک موتور جستجوی رایگان است که دسترسی به چندین پایگاه داده‌ی اصلی در گستره وسیعی از رشته‌های علوم‌پزشکی و زیست‌شناسی را فراهم می‌کند. PubMed توسط سایت NCBI وابسته به کتابخانه ملی پزشکی، نگهداری و به‌روزرسانی می‌شود. PubMed به پایگاه داده MEDLINE از منابع و چکیده‌های علوم زیستی و موضوعات زیست‌پزشکی دسترسی دارد.

کتابخانه ملی پزشکی ایالات متحده (NLM) در مؤسسه ملی بهداشت، پایگاه داده را به‌عنوان بخشی از سیستم بازیابی اطلاعات Entrez نگهداری می‌کند. از سال ۱۹۷۱ تا ۱۹۹۷، دسترسی آنلاین به پایگاه داده MEDLINE  از طریق امکانات سازمانی مانند کتابخانه‌های دانشگاهی بود.PubMed  برای اولین بار در ژانویه ۱۹۹۶ منتشر شد و عصر جستجوی MEDLINE خصوصی، رایگان، خانگی و اداری را آغاز کرد. سیستم PubMed از ژوئن ۱۹۹۷ برای عموم رایگان ارائه شد.

سایت NCBI
PubMed

 

۳. PMC

“PubMed Central” یک مخزن دیجیتال رایگان است که مقالات علمی با دسترسی آزاد را که در مجلات زیست‌پزشکی و علوم‌زیستی منتشر شده‌اند، بایگانی می‌کند. PubMed Central به‌عنوان یکی از پایگاه‌های تحقیقاتی اصلی که توسط مرکز ملی اطلاعات بیوتکنولوژی (سایت NCBI) توسعه یافته است، چیزی بیش از یک مخزن اسناد است. موارد ارسالی به “PMC” برای فراداده‌های پیشرفته، هستی‌شناسی‌پزشکی و ‌شناسه‌های منحصربه‌فرد، فهرست‌بندی و قالب‌بندی می‌شوند که داده‌های ساختار‌یافته “XML” را برای هر مقاله غنی می‌کنند. محتوای داخل PMC را می‌توان به سایر پایگاه‌های داده سایت NCBI پیوند داد و از این طریق به آن دسترسی داشت. سیستم‌های جستجو و بازیابی Entrez، توانایی عمومی برای کشف، خواندن و ایجاد دانش زیست‌پزشکی را بیشتر می‌کنند.

سایت NCBI
PubMed Central

 

۴. OMIM

وراثت آنلاین مندلی در انسان (OMIM) یک کاتالوگ به‌روزرسانی مداوم از ژن‌های انسان، اختلالات و صفات ژنتیکی است که تمرکز ویژه‌ای بر رابطه ژن-فنوتیپ دارد. از ۲۸ ژوئن ۲۰۱۹، نزدیک به ۹۰۰۰ مورد از بیش از ۲۵۰۰۰ ورودی درOMIM ، فنوتیپ‌ها را نشان می‌دادند.

سایت NCBI
OMIM

 

۵. OMIA

وراثت آنلاین مندلی در حیوانات (OMIA) یک پایگاه داده‌ی آنلاین از ژن‌ها، اختلالات ارثی و صفات در بیش از ۱۳۵ گونه حیوانی است. این، الگوبرداری شده و مکمل وراثت مندلی آنلاین در انسان (OMIM) است. هدف آن ارائه یک کاتالوگ در دسترس عموم از همه صفات حیوانی است، به‌استثنای آن‌هایی که در انسان و موش هستند، که به‌عنوان منابع خاصی در دسترس هستند. این پایگاه داده که توسط پروفسور فرانک نیکولاس از دانشگاه سیدنی نوشته ‌شده ‌است، با مشارکت همکارانش، حاوی اطلاعات متنی، منابع و همچنین پیوندهایی به سوابق PubMed و “Gene” مربوطه در سایت NCBI است.

سایت NCBI
OMIA

 

۶. Bookshelf

“Bookshelf”یک سرویس آنلاین آرشیو ادبیات کتابخانه ملی پزشکی (NLM LitArch) است که دسترسی رایگان به متن کامل بیش از ۱۳۰۰ کتاب، گزارش، پایگاه داده و اسناد در زمینه‌های علوم‌زیستی و مراقبت‌های بهداشتی را فراهم می‌کند. به‌طور تقریبی ۲۸ عنوان جدید در هر ماه در سال ۲۰۱۲ اضافه شد. عناوین موجود، به‌ویژه آن‌هایی که در دسته پایگاه داده و اسناد قرار دارند، همچنان در حال رشد هستند و به‌روز‌رسانی‌های منظم را دریافت می‌کنند.

اطلاعات موجود در Bookshelf به سایر منابع سایت NCBI مانند PubMed، Gene، “GTR” و “PubChem”مرتبط و یکپارچه شده است. این ادغام کاربر را قادر می‌سازد تا به اطلاعات ژنتیکی و ساختاری مولکولی از ادبیات دسترسی متقابل داشته باشد و مسیر‌های بیشتری برای کشف در این شبکه اطلاعاتی مرتبط ارائه می‌دهد. در سال ۲۰۱۲، بخشی از محتوای Bookshelf در “NLM LitArch”، زیرمجموعه دسترسی آزاد NLM LitArch در دسترس قرار گرفت.

 

۷. Journals

دسترسی به عناوین، مخفف و ISSN مجلات

 

۸. MeSH

MeSH یک واژگان کنترل‌شده جامع برای نمایه‌سازی مقالات مجلات و کتاب‌های علوم‌زیستی است. MeSH به‌عنوان فرهنگ لغت وابسته به سایت NCBI، جستجو را تسهیل می‌کند. این کتابخانه که توسط کتابخانه ملی پزشکی ایالات متحده (NLM) ایجاد و به‌روز شده است، توسط پایگاه داده مقالات MEDLINE و PubMed و کاتالوگ کتاب‌های NLM مورد استفاده قرار می‌گیرد. MeSH همچنین توسط “ClinicalTrials.gov” برای طبقه‌بندی بیماری‌هایی که توسط کارآزمایی‌های ثبت‌شده در “ClinicalTrials”مورد مطالعه قرار می‌گیرند، استفاده می‌شود.

سایت NCBI
MeSH

 

۹. RefSeq

در مواردی که یک مولکول با چند توالی برای یک ارگانیسم در GenBank آورده شود، سایت NCBI تلاش می‌کند تا بهترین توالی را انتخاب و به‌عنوان رکورد “RefSeq” معرفی کند (رکورد RefSeq تا حد امکان به دور از جهش، اشتباهات تعیین توالی و تغییرات ناشی از کلونینگ می‌باشد).

سایت NCBI
RefSeq

 

۱۰. dbEST

dbEST یک بخش از GenBank وابسته به سایت NCBI است. dbEST حاوی اطلاعاتی در مورد توالی ها است. “EST”، توالی‌های DNA کوتاهی هستند که بین ۳۰۰ تا ۵۰۰ باز دارند و از تعیین ترادف یک یا هر دو انتهای بیان‌شونده‌ی ژن به‌وجود می‌آیند. از روی “mRNA” ابتدا  “cDNA” ساخته و کلون می‌شود؛ بر‌حسب اینکه کدام انتهای cDNA  توالی‌یابی شود، ۳EST’ یا ۵EST’ به‌دست می‌آید.

 

۱۱. GSS

“GSS” شبیه “EST” است. تفاوت GSS با EST در این است که منشأ GSS، ژنومی است؛ در‌حالی‌که منشأ EST مولکول mRNA است. توالی‌های GSS کوتاه و تصادفی هستند و به‌طور معمول از انتهای کلون‌های کاسمید و “BAC” به‌دست می‌آیند.

 

۱۲. GTR

“Genetic testing registry”منبع جدیدی است که اطلاعات مربوط به آزمایشات ژنتیکی را که به‌طور داوطلبانه توسط ارائه‌دهندگان آزمایش ارسال شده است، جمع‌آوری و نمایش می‌دهد (این اطلاعات شامل هدف، روش‌شناسی، اعتبار و شواهد مفید‌بودن یک آزمایش و همچنین تماس‌ها، اعتبارنامه‌ها و گواهی‌های آزمایشگاه‌هایی است که آزمایش را انجام می‌دهند). “GTR” همچنین دسترسی متنی به داده‌ها از منابع سایت NCBI مانندGene database، PubMed و Bookshelf را در دستورالعمل‌های بالینی و منابع ارجاع بالینی فراهم می‌کند.

کاربران می‌توانند محتوای GTR را درباره آزمایش‌ها، شرایط، فنوتیپ‌ها، ژن‌ها، آزمایشگاه‌ها و “GeneReviews” جستجو کنند. محتوای GTR در حال حاضر شامل آزمایش‌های بیوشیمیایی، سیتوژنتیک و مولکولی برای اختلالات مندلی و پاسخ‌های دارویی است.

 

طبقه بندی منابع سایت NCBI

منابع سایت NCBI به دسته‌های زیر طبقه‌بندی می‌شوند:

۱. شیمیایی و زیست‌سنجی؛

۲. داده و نرم‌افزار؛

۳. DNA  و RNA؛

۴. دامنه‌ها و ساختار‌ها؛

۵. ژن‌ها و بیان؛

۶. ژنتیک و پزشکی؛

۷. ژنوم‌ها و نقشه‌ها؛

۸. همسانی؛

۹. ادبیات؛

۱۰. پروتئین‌ها؛

۱۱. تجزیه و تحلیل توالی؛

۱۲. طبقه‌بندی؛

۱۳. تغییر.

 

کاربرد سایت NCBI

از وظایف سایت NCBI می‌توان به موارد زیر اشاره کرد:

۱. ایجاد ساختار برای تحلیل و ذخیره‌سازی داده‌های تحقیقات ژنتیک، بیوشیمی و زیست‌شناسی مولکولی؛

۲. ترویج و شیوع استفاده از این دیتابیس‌ها در میان جامعه‌ی محققین؛

۳. هماهنگ‌سازی اطلاعات با دیگر مراکز مشابه جهانی؛

۴. پیش‌برد پژوهش در تحلیل‌های رایانه‌ای روابط کارکردی-ساختاری مولکول‌های کلیدی.

 

 

نویسنده: حدیث پرهیزگاری
ویراستار: سارا تاجداری

 

منابع
  1. Bioinformatics basics: applications in biological science and medicine. Hooman H. Rashidi, Lukas K. Buehler. Publisher CRC Press, 2000. ISBN 0-8493-2375-4 pp.34-44
  2. 2. Tateno Y, Imanishi T, Miyazaki S, Fukami-Kobayashi K, Saitou N, Sugawara H, et al. (2002). “DNA Data Bank of Japan (DDBJ) for genome scale research in life science”. Nucleic Acids Res. 30 (1): 27–30. doi:10.1093/nar/30.1.27. PMC 99140. PMID 11752245.
  3. 3. Kaminuma E, Kosuge T, Kodama Y, et al. (January 2011). “DDBJ progress report”. Nucleic Acids Res. 39 (Database issue): D22–7. doi:10.1093/nar/gkq1041. PMC 3013661. PMID 21062814.
  4. OMIA (Online Mendelian Inheritance in Animals): an enhanced platform and integration into the Entrez search interface at NCBI. Nucleic Acids Res. 2006 Jan 1;34(Database issue):D599-601. doi:10.1093/nar/gkj152 PMID 16381939
  5. 5. Rubinstein WS, Maglott DR, Lee J,  Kattman BL,  Malheiro AJ,  Fomous C,  Ostell JM. The NIH Genetic Testing Registry: a new, centralized database of genetic tests to enable access to comprehensive information and improve transparency, Nucleic Acids Res., 2013, vol. 41 (pg. D925-D935)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا