فهرست مطالب
مرکز ملی اطلاعات زیستفناوری (به انگلیسی: National Center for Biotechnology Information) معروف به سایت “NCBI” یکی از مراکز و شاخههای کتابخانه ملی پزشکی ایالات متحده آمریکا است که در زیرمجموعه مؤسسهی ملی سلامت”NIH” قرار دارد. مؤسسهی ملی سلامت در نهایت زیر مجموعهی وزارت بهداشت و خدمات انسانی ایالات متحده آمریکا است. این مرکز در پی تصویب طرح پیشنهادی سناتور کلود پپر در کنگره آمریکا شکل گرفت. مرکز ملی اطلاعات زیستفناوری در شهر بتزدا در ایالت مریلند قرار دارد.
سایت NCBI در تونل زمان
در نوامبر ۱۹۸۸ بخش جدیدی به كتابخانه پزشكی ملی آمریكا (NLM) افزوده شد تا روشهای كامپیوتری پردازش اطلاعات جهت هدایت تحقیقات “Biomedical” ایجاد شود. این بخش مهم، مركز ملی اطلاعات زیستفناوری یا سایت NCBI نام گرفت. كتابخانه ملی پزشكی آمریكا در سازمان ملی بهداشت آمریكا (NIH) قرار گرفته است؛ تجربههای موفق این كتابخانه در ایجاد و نگهداری پایگاههای داده در زمینه Biomedical و بهعنوان بخشی از NIH باعث ایجاد یك برنامه تحقیقاتی در زمینه بیولوژی مولكولی كامپیوتری، شده است.
امروزه کاربرد سایت NCBI به شکل چشمگیری افزایش یافته و بهعنوان بزرگترین مركز تحقیقات Biomedical در دنیا شناخته شده است. انستیتوی NCBI جهت رسیدن به اهداف خود فعالیتهای زیر را دنبال میكند:
۱. هدایت تحقیقاتی در زمینه مسائل اصولی Biomedical در سطح مولكولی با بهرهگیری از روشهای ریاضی و كامپیوتری؛
۲. همكاری با انستیتوهای دیگر NIH، دانشگاهها، صنعت و دیگر سازمانهای دولتی؛
۳. ایجاد ارتباطهای علمی بهوسیله برگزاركردن همایشها، كارگاههای آموزشی و سلسله سخنرانیها؛
۴. برنامههای تحصیلاتی برای دانشجویان در زمینههای بیولوژی كامپیوتری توسعه و انتشار نرمافزارها و پایگاههای داده مختلف.
آشنایی با سایت NCBI
با تکمیل پروژهی ژنوم انسان، یکی از اهداف مهم بیوانفورماتیک که تحلیل توالیها میباشد، محقق شد؛ اما در گذر زمان با پیشرفتهایی که در زمینهی بیوانفورماتیک حاصل شد، احساس نیاز به یک پایگاه داده که تمام اطلاعات مربوط به توالی ژنها و پروتئینها را ذخیره و نگهداری کند، بیشتر نمایان شد. علم بیوانفورماتیک با بهرهگیری از پایگاههای دادهی متعدد و نرمافزارهای مختلف، امکان بررسی ساختار، عملکرد، تفاوتهای توالیهای متعدد بهمنظور مطالعات تکاملی و … را فراهم میکند.
تا به امروز اطلاعات مربوط به توالیهای موجودات مختلف در پایگاههای داده ذخیره و برای اهداف گوناگون در اختیار محققین قرار گرفته است. همانطور که اشاره شد، حفظ و نگهداری انبوه اطلاعات ژنتیکی بهمنظور دسترسی سریع محققین نیازمند پایگاه دادههای زیستی یا بانک اطلاعاتی است که یکی از این بانکهای اطلاعاتی، سایت NCBI نام دارد.
پایگاههای دادهی سایت NCBI
بهمنظور معرفی سایت NCBI، بهتر است بدانیم که سایت NCBI مجموعهای از پایگاههای دادهی مرتبط با بیوتکنولوژی و پزشکیزیستی را در خود جای داده و منبع مهمی برای ابزارها و خدمات بیوانفورماتیک است.
از جمله پایگاههای دادهی اصلی میتوان به “GeneBank”، “EMBL”و “DDBJ” اشاره کرد که بهترتیب پایگاه دادهی GeneBank توسط مرکز ملی اطلاعات بیوتکنولوژی آمریکا (NCBI) واقع در انستیتو ملی سلامت (NIH)، پایگاه دادهی EMBL توسط انستیتو بیوانفورماتیک اروپا (EBI) و پایگاه دادهی “DDBJ” توسط انستیتو ملی ژنتیک ژاپن اداره میشود. این پایگاههای داده به گونهای طراحی شدهاند که افزودن یا بهروزکردن اطلاعات حتی توسط کاربران نیز امکانپذیر است؛ لذا اطلاعات یا دادههای جدید هر ۲۴ ساعت بین این سه پایگاه داده اشتراکگذاری و مبادله میشود.
۱. پایگاه دادهی GeneBank
GeneBank بهعنوان جامعترین پایگاه داده سایت NCBI، علاوهبر فراهمکردن مکانی برای ذخیرهسازی اطلاعات، شامل انبوهی از مقالات علمی در زمینهی زیستشناسی و علوم مرتبط، اطلاعات مربوط بهDNA ژنومی، اطلاعات مربوط به “STS” ، اطلاعات مربوط به “GSS” ، اطلاعات مربوط به “EST” و … است.
۲. پایگاه داده EMBL
از پایگاههای داده زیرمجموعه سایت NCBI، میتوان به پایگاه دادهی EMBL اشاره کرد. مؤسسه بیوانفورماتیک اروپایی(EMBL-EBI) یک سازمان بیندولتی (IGO) است که بهعنوان بخشی از خانواده آزمایشگاه بیولوژی مولکولی اروپا (EMBL) بر تحقیقات و خدمات در بیوانفورماتیک تمرکز دارد. این دانشگاه در پردیس ژنوم Wellcome در Hinxton در نزدیکی کمبریج واقع شده است.
۳. پایگاه داده DDBJ
بانک اطلاعات DNA ژاپن (DDBJ)، یکی دیگر از پایگاههای زیر مجموعه سایت NCBI است. این پایگاه دادهی بیولوژیکی، توالیهای DNA را جمعآوری میکند و در مؤسسه ملی ژنتیک (NIG) در استان شیزوکا ژاپن واقع شده است؛ همچنین عضوی از همکاری بینالمللی پایگاه دادهی توالی نوکلئوتیدی یا”INSDC” است.
سایت NCBI دارای ابزارهای نرمافزاری است که از طریق مرورگرهای اینترنتی یا “FTP” در دسترس هستند. برای مثال، “BLAST”یک برنامهی جستجوی شباهت توالی است. BLAST میتواند مقایسه توالی با پایگاه داده “DNA GenBank” را در کمتر از ۱۵ ثانیه انجام دهد. آسانترین روش برای یافتن اطلاعات مربوط به یک ژن در پایگاه NCBI استفاده از موتور جستجوی این سایت به نام “Entrez” است. اگر به صفحهی اول سایت NCBI به آدرس https://www.ncbi.nlm.nih.g بروید با موتور جستجوی Entrez روبرو خواهید شد که امکان جستجو از بین چندین منبع داده را فراهم میآورد. برخی از این منابع عبارتند از:
۱. MEDLINE
“Medical Literature Analysis and Retrieval System Online” یکی از معروفترین پایگاههای دادهی سایت NCBI است. MEDLINE یک پایگاه داده کتابشناختی از علومزیستی و اطلاعات زیستپزشکی است. این شامل اطلاعات کتابشناختی برای مقالات مجلات دانشگاهی است که پزشکی، پرستاری، داروسازی، دندانپزشکی، دامپزشکی، مراقبتهای بهداشتی، ادبیات زیستشناسی، تکامل مولکولی و بیوشیمی را پوشش میدهد.
۲. PubMed
“PubMed ” یک موتور جستجوی رایگان است که دسترسی به چندین پایگاه دادهی اصلی در گستره وسیعی از رشتههای علومپزشکی و زیستشناسی را فراهم میکند. PubMed توسط سایت NCBI وابسته به کتابخانه ملی پزشکی، نگهداری و بهروزرسانی میشود. PubMed به پایگاه داده MEDLINE از منابع و چکیدههای علوم زیستی و موضوعات زیستپزشکی دسترسی دارد.
کتابخانه ملی پزشکی ایالات متحده (NLM) در مؤسسه ملی بهداشت، پایگاه داده را بهعنوان بخشی از سیستم بازیابی اطلاعات Entrez نگهداری میکند. از سال ۱۹۷۱ تا ۱۹۹۷، دسترسی آنلاین به پایگاه داده MEDLINE از طریق امکانات سازمانی مانند کتابخانههای دانشگاهی بود.PubMed برای اولین بار در ژانویه ۱۹۹۶ منتشر شد و عصر جستجوی MEDLINE خصوصی، رایگان، خانگی و اداری را آغاز کرد. سیستم PubMed از ژوئن ۱۹۹۷ برای عموم رایگان ارائه شد.
۳. PMC
“PubMed Central” یک مخزن دیجیتال رایگان است که مقالات علمی با دسترسی آزاد را که در مجلات زیستپزشکی و علومزیستی منتشر شدهاند، بایگانی میکند. PubMed Central بهعنوان یکی از پایگاههای تحقیقاتی اصلی که توسط مرکز ملی اطلاعات بیوتکنولوژی (سایت NCBI) توسعه یافته است، چیزی بیش از یک مخزن اسناد است. موارد ارسالی به “PMC” برای فرادادههای پیشرفته، هستیشناسیپزشکی و شناسههای منحصربهفرد، فهرستبندی و قالببندی میشوند که دادههای ساختاریافته “XML” را برای هر مقاله غنی میکنند. محتوای داخل PMC را میتوان به سایر پایگاههای داده سایت NCBI پیوند داد و از این طریق به آن دسترسی داشت. سیستمهای جستجو و بازیابی Entrez، توانایی عمومی برای کشف، خواندن و ایجاد دانش زیستپزشکی را بیشتر میکنند.
۴. OMIM
وراثت آنلاین مندلی در انسان (OMIM) یک کاتالوگ بهروزرسانی مداوم از ژنهای انسان، اختلالات و صفات ژنتیکی است که تمرکز ویژهای بر رابطه ژن-فنوتیپ دارد. از ۲۸ ژوئن ۲۰۱۹، نزدیک به ۹۰۰۰ مورد از بیش از ۲۵۰۰۰ ورودی درOMIM ، فنوتیپها را نشان میدادند.
۵. OMIA
وراثت آنلاین مندلی در حیوانات (OMIA) یک پایگاه دادهی آنلاین از ژنها، اختلالات ارثی و صفات در بیش از ۱۳۵ گونه حیوانی است. این، الگوبرداری شده و مکمل وراثت مندلی آنلاین در انسان (OMIM) است. هدف آن ارائه یک کاتالوگ در دسترس عموم از همه صفات حیوانی است، بهاستثنای آنهایی که در انسان و موش هستند، که بهعنوان منابع خاصی در دسترس هستند. این پایگاه داده که توسط پروفسور فرانک نیکولاس از دانشگاه سیدنی نوشته شده است، با مشارکت همکارانش، حاوی اطلاعات متنی، منابع و همچنین پیوندهایی به سوابق PubMed و “Gene” مربوطه در سایت NCBI است.
۶. Bookshelf
“Bookshelf”یک سرویس آنلاین آرشیو ادبیات کتابخانه ملی پزشکی (NLM LitArch) است که دسترسی رایگان به متن کامل بیش از ۱۳۰۰ کتاب، گزارش، پایگاه داده و اسناد در زمینههای علومزیستی و مراقبتهای بهداشتی را فراهم میکند. بهطور تقریبی ۲۸ عنوان جدید در هر ماه در سال ۲۰۱۲ اضافه شد. عناوین موجود، بهویژه آنهایی که در دسته پایگاه داده و اسناد قرار دارند، همچنان در حال رشد هستند و بهروزرسانیهای منظم را دریافت میکنند.
اطلاعات موجود در Bookshelf به سایر منابع سایت NCBI مانند PubMed، Gene، “GTR” و “PubChem”مرتبط و یکپارچه شده است. این ادغام کاربر را قادر میسازد تا به اطلاعات ژنتیکی و ساختاری مولکولی از ادبیات دسترسی متقابل داشته باشد و مسیرهای بیشتری برای کشف در این شبکه اطلاعاتی مرتبط ارائه میدهد. در سال ۲۰۱۲، بخشی از محتوای Bookshelf در “NLM LitArch”، زیرمجموعه دسترسی آزاد NLM LitArch در دسترس قرار گرفت.
۷. Journals
دسترسی به عناوین، مخفف و ISSN مجلات
۸. MeSH
MeSH یک واژگان کنترلشده جامع برای نمایهسازی مقالات مجلات و کتابهای علومزیستی است. MeSH بهعنوان فرهنگ لغت وابسته به سایت NCBI، جستجو را تسهیل میکند. این کتابخانه که توسط کتابخانه ملی پزشکی ایالات متحده (NLM) ایجاد و بهروز شده است، توسط پایگاه داده مقالات MEDLINE و PubMed و کاتالوگ کتابهای NLM مورد استفاده قرار میگیرد. MeSH همچنین توسط “ClinicalTrials.gov” برای طبقهبندی بیماریهایی که توسط کارآزماییهای ثبتشده در “ClinicalTrials”مورد مطالعه قرار میگیرند، استفاده میشود.
۹. RefSeq
در مواردی که یک مولکول با چند توالی برای یک ارگانیسم در GenBank آورده شود، سایت NCBI تلاش میکند تا بهترین توالی را انتخاب و بهعنوان رکورد “RefSeq” معرفی کند (رکورد RefSeq تا حد امکان به دور از جهش، اشتباهات تعیین توالی و تغییرات ناشی از کلونینگ میباشد).
۱۰. dbEST
dbEST یک بخش از GenBank وابسته به سایت NCBI است. dbEST حاوی اطلاعاتی در مورد توالی ها است. “EST”، توالیهای DNA کوتاهی هستند که بین ۳۰۰ تا ۵۰۰ باز دارند و از تعیین ترادف یک یا هر دو انتهای بیانشوندهی ژن بهوجود میآیند. از روی “mRNA” ابتدا “cDNA” ساخته و کلون میشود؛ برحسب اینکه کدام انتهای cDNA توالییابی شود، ۳EST’ یا ۵EST’ بهدست میآید.
۱۱. GSS
“GSS” شبیه “EST” است. تفاوت GSS با EST در این است که منشأ GSS، ژنومی است؛ درحالیکه منشأ EST مولکول mRNA است. توالیهای GSS کوتاه و تصادفی هستند و بهطور معمول از انتهای کلونهای کاسمید و “BAC” بهدست میآیند.
۱۲. GTR
“Genetic testing registry”منبع جدیدی است که اطلاعات مربوط به آزمایشات ژنتیکی را که بهطور داوطلبانه توسط ارائهدهندگان آزمایش ارسال شده است، جمعآوری و نمایش میدهد (این اطلاعات شامل هدف، روششناسی، اعتبار و شواهد مفیدبودن یک آزمایش و همچنین تماسها، اعتبارنامهها و گواهیهای آزمایشگاههایی است که آزمایش را انجام میدهند). “GTR” همچنین دسترسی متنی به دادهها از منابع سایت NCBI مانندGene database، PubMed و Bookshelf را در دستورالعملهای بالینی و منابع ارجاع بالینی فراهم میکند.
کاربران میتوانند محتوای GTR را درباره آزمایشها، شرایط، فنوتیپها، ژنها، آزمایشگاهها و “GeneReviews” جستجو کنند. محتوای GTR در حال حاضر شامل آزمایشهای بیوشیمیایی، سیتوژنتیک و مولکولی برای اختلالات مندلی و پاسخهای دارویی است.
طبقه بندی منابع سایت NCBI
منابع سایت NCBI به دستههای زیر طبقهبندی میشوند:
۱. شیمیایی و زیستسنجی؛
۲. داده و نرمافزار؛
۳. DNA و RNA؛
۴. دامنهها و ساختارها؛
۵. ژنها و بیان؛
۶. ژنتیک و پزشکی؛
۷. ژنومها و نقشهها؛
۸. همسانی؛
۹. ادبیات؛
۱۰. پروتئینها؛
۱۱. تجزیه و تحلیل توالی؛
۱۲. طبقهبندی؛
۱۳. تغییر.
کاربرد سایت NCBI
از وظایف سایت NCBI میتوان به موارد زیر اشاره کرد:
۱. ایجاد ساختار برای تحلیل و ذخیرهسازی دادههای تحقیقات ژنتیک، بیوشیمی و زیستشناسی مولکولی؛
۲. ترویج و شیوع استفاده از این دیتابیسها در میان جامعهی محققین؛
۳. هماهنگسازی اطلاعات با دیگر مراکز مشابه جهانی؛
۴. پیشبرد پژوهش در تحلیلهای رایانهای روابط کارکردی-ساختاری مولکولهای کلیدی.
نویسنده: حدیث پرهیزگاری
ویراستار: سارا تاجداری
منابع
-
Bioinformatics basics: applications in biological science and medicine. Hooman H. Rashidi, Lukas K. Buehler. Publisher CRC Press, 2000. ISBN 0-8493-2375-4 pp.34-44
-
2. Tateno Y, Imanishi T, Miyazaki S, Fukami-Kobayashi K, Saitou N, Sugawara H, et al. (2002). “DNA Data Bank of Japan (DDBJ) for genome scale research in life science”. Nucleic Acids Res. 30 (1): 27–30. doi:10.1093/nar/30.1.27. PMC 99140. PMID 11752245.
-
3. Kaminuma E, Kosuge T, Kodama Y, et al. (January 2011). “DDBJ progress report”. Nucleic Acids Res. 39 (Database issue): D22–7. doi:10.1093/nar/gkq1041. PMC 3013661. PMID 21062814.
-
OMIA (Online Mendelian Inheritance in Animals): an enhanced platform and integration into the Entrez search interface at NCBI. Nucleic Acids Res. 2006 Jan 1;34(Database issue):D599-601. doi:10.1093/nar/gkj152 PMID 16381939
-
5. Rubinstein WS, Maglott DR, Lee J, Kattman BL, Malheiro AJ, Fomous C, Ostell JM. The NIH Genetic Testing Registry: a new, centralized database of genetic tests to enable access to comprehensive information and improve transparency, Nucleic Acids Res., 2013, vol. 41 (pg. D925-D935)
یک نظر