مفاهیم آرشیو منابع دیجیتال

از NOSA Wiki
پرش به: ناوبری، جستجو

ضرورت گذر کتابخانه ها از ساختارهای سنتی به ساختار دیجیتال

کتابخانهها و مراکز اسناد علاوه بر نگهداری اصل منابع خود به دو دلیل نیازمند نگهداری فرم دیجیتال آنها نیز هستند.

دلیل اول گرانبها بودن منابع کتابخانه و یا در مواردی، نفیس بودن منابع (نسخ سنگی و خطی) میتواند محدودیتهای زیادی را برای استفاده از منابع ایجاد نماید و کتابخانهها میتوانند با ارائه فرم رایانهای، مقدار قابل توجهی از نیاز مراجعین را برطرف کنند.

دلیل دوم نیاز به دسترسی از راه دور (از طریق اینترنت) به منابع و مدارک میباشد که جز با تبدیل آنها به فرم رایانهای امکانپذیر نمیباشد.


مفهوم منبع دیجیتال

عبارت منبع دیجیتال ترجمه Digital Resource است. منبع دیجیتال، فرمی از یک اثر کتابشناختی میباشد که به منظور استفاده توسط رایانه تهیه شده است. در زبان انگلیسی از عبارات دیگری نظیر Computer File یا Electronic Resource نیز برای همین مفهوم استفاده می‌شود. یک منبع دیجیتال حتما باید درون یک حامل قرار گیرد تا بتوان به صورت مستقیم و یا از راه دور به منبع دیجیتال دسترسی پیدا کرد.

طبق این تعریف، فایل‌های رایانه‌ای مثلا با فرمت PDF و DOC و همچنین فایل‌های حاوی اطلاعات پایگاه داده و یا سایر فایل‌های رایانه‌ای که برای مشاهده محتویات آنها نیاز به نرم‌افزار می‌باشد، جزء منابع دیجیتال محسوب می‌شوند. در حال حاضر تقریبا هر نوع مدرک کتابشناختی را می‌توان به یک یا چند فرمت مناسب از فایل‌های رایانه‌ای تبدیل کرده و در حافظه‌های رایانه ذخیره کرد.

چگونگی تولید و گردآوری منابع دیجیتال

نوع اول، نسخه دیجیتال شده یک اثر کتابشناختی و چاپی می‌باشد.

به طور مثال کتاب الکترونیکی (EBook)، پایان‌نامه‌های دانشجویی با فرم فایل MS Word، فایل حاصل از Scan یک عکس به فرم TIFF و یا نامه‌های وارده و صادره، قراردادها، فاکتورها و ...که حاصل اسکن از نسخه چاپی موجود در بایگانی هستند.

نوع دوم، فایل‌های رایانه‌ای که لزوما ما به ازای فیزیکی یا کتابشناختی ندارند.

به طور مثال عکس‌های گرفته شده توسط یک دوربین دیجیتال با فرم فایل JPG، فایل سخنرانی ارائه شده در یک همایش به فرم PPT، فایل حاصل از Scan یک صفحه از یک کتاب با فرم TIFF


نمودار چگونگی تولید و گردآوری منابع دیجیتال

مفهوم دسته‌بندی درختی و ساختار کد

استفاده از ساختار درختی برای نگهداری منابع دیجیتال، این امکان را بوجود آورده است که همزمان با نگهداری خود منابع دیجیتال، یا آدرس درون پایگاه اطلاعات آنها، بتوان ارتباط منابع دیجیتال با یکدیگر را نیز ثبت و نگهداری کرد. ساختار درختی منابع دیجیتال، همزمان با ورود اطلاعات منابع شکل می گیرد. در واقع، منابع دیجیتال تشکیل دهنده شاخه ها و برگهای درخت منابع دیجیتال هستند. هر منبع دیجیتال می تواند دارای زیرشاخه و یا فاقد زیرشاخه باشد. شاخه‌هایی که در کنار یکدیگر قرار می‌گیرند، یک سطح را تشکیل می دهند. علاوه بر آن استفاده از کدینگ انعطاف‌پذیر برای شماره‌گذاری منابع دیجیتال در درخت، امکان شناسایی دقیق منبع دیجیتال را در آرشیو فراهم کرده است.


ساختار درختی منابع دیجیتال

ویژگیهای درخت منابع دیجیتال در نرم افزار آرشیو نوسا

1. امکان ذخیره فایل یک منبع دیجیتال در هر سطحی از درخت وجود دارد. ماهیت سطوح درخت به گونه‌ای است که هم می‌تواند حاوی فایل باشد و هم برای دسته‌بندی منابع دیجیتال مورد استفاده قرار گیرد.

2. سطوح درخت می‌توانند دارای عمق‌های متفاوتی باشند و محدودیتی برای یکسان بودن عمق درخت در بخش‌های مختلف وجود ندارد.

3. امکان استفاده از سیستم کدینگ بسیار پیشرفته، برای شماره‌گذاری منابع دیجیتال به نحوی که تعداد ارقام زیرگروه هر منبع دیجیتال به صورت اختصاصی قابل تعیین است.

به عنوان مثال در یک سطح می‌توان یک منبع دیجیتال با زیرگروه 2 رقمی را در کنار یک منبع دیجیتال با زیرگروه 3 رقمی نگهداری کرد.

4. امکان نگهداری منابع دیجیتالی که به صورت ساده و تک فایل نیستند، بلکه دارای اجزای متعددی می‌باشند، در ساختار درختی براحتی میسر است. به عنوان مثال یک کتاب، دارای چند جلد و هر جلد، دارای چند فصل باشد.

5. امکان پیاده‌سازی شیوه‌های دسته‌بندی مناسب با ساختار مورد نیاز مرکز میسر است. مناسب‌ترین شیوه دسته‌بندی برای آرشیو های کوچک و متوسط،دسته‌بندی محتوایی درخت منابع دیجیتال است. در آرشیوهای بزرگ، تعداد منابع دیجیتال بقدری زیاد است که امکان تفکیک محتوایی وجود ندارد و منابع با همان دسته‌بندی که وارد آرشیو می‌شوند در سیستم ذخیره می گردند.


شاخه درخت منابع دیجیتال


مفهوم قالب منابع دیجیتال

قالب منبع دیجیتال بیانگر نوع فایل از نظر ساختاری است و معمولا قابل استخراج خودکار به کمک پسوند فایل می‌باشد. تعیین قالب جهت تعیین چگونگی رفتار نرم‌افزارها با فایل استفاده می‌شود.

قالب‌ خاص

هر فایل دارای یک نام و یک مشخصه می‌باشد. مشخصه یا پسوند فایل که به آن Extention نیز می‌گویند، معمولاً سه حرفی است و نشاندهنده فرمت یا نوع فایل است. فرمت فایل یک روش استاندارد جهت نشان دادن ساختار فایل، به عنوان مثال باینری (Binary) یا اسکی (Ascii) می‌باشد. با استفاده از فرمت یک فایل، سیستم عامل می‌تواند فایل را متناسب با نوع آن اجرا و پردازش کند. فرمت یک فایل، از روش‌های مختلفی قابل شناسایی است، یکی از این روش‌ها که در سیستم‌عامل ویندوز استفاده می‌شود، شناسایی مشخصه یا پسوند فایل است.

نکته: پسوند فایل، الزاماً فرمت فایل را نشان نمی‌دهد. ممکن است با یک دستکاری ساده، پسوند فایل تغییر داده شود. به هرحال، بحث ما این استثناءها نمی‌باشد، همچنین ممکن است فایلی دارای هیچ پسوندی نباشد! در نرم‌افزار آرشیو و نگهداری منابع دیجیتال، هنگام افزودن منبع، قالب خاص به صورت خودکار از طریق پسوند فایل، استخراج می‌گردد. این عمل به شرطی قابل انجام است که قالب خاص آن فایل در فهرست قالب‌های خاص، از قبل به نرم‌افزار معرفی شده باشد. (تعریف و ویرایش انواع قالب‌های خاص)

قالب‌ عام

منابع دیجیتال به پنج دسته کلی تقسیم می‌شوند که به این دسته‌ها قالب‌های عام گفته می شود، در واقع می‌توان گفت قالب‌های عام، نوعی دسته‌بندی قالبهای خاص بوده و به شرح زیر می‌باشند:

متن: تمام فايل‌‌هاي رايانه‌اي نظير DOC و PDF که به طور کلي براي ذخيره فرم رايانه­‌ای منابع متني نظير کتاب، مقاله، پايان‌نامه و ساير اسناد به کار مي روند.

عکس: تمام فايل‌هاي رايانه‌ای نظير PNG ،JPG ، BMP و غيره که براي ذخيره فرم رايانه‌ای عکس، پوستر و يا تصاوير اسناد به کار مي روند.

ماده شنیداری: تمام فايل‌هاي رايانه‌ای نظير MP3، WAV و غيره که براي ذخيره فرم رايانه‌ای موسيقي و يا مواد گفتاري نظير سخنراني به کار مي روند.

ماده دیداری: تمام فايل‌هاي رايانه‌اي نظير DIVX، AVI، MPEG و غيره که براي ذخيره فرم رايانه‌اي فيلم ها و تصاوير متحرک به کار مي روند.

فایل رايانه‌اي: ساير فايل‌هاي رايانه‌اي نظير فايل‌هاي نرم‌افزارهاي خاص مهندسي (به طور مثال Autocad) و يا هرگونه فايل‌هاي اطلاعاتي ديگر که جزء چهاردسته قبل نيستند.

نکته: قالب‌های عام به‌صورت پیش فرض در نرم‌افزار آرشیو و فروش نوسا تعریف شده‌اند.

قالب‌های عام تعریف شده در نرم‌افزار آرشیو و فروش نوسا را می‌توان در شکل زیر مشاهده نمایید.


فهرست قالب‌های عام

مفهوم محتوی منابع دیجیتال


هر منبع دیجیتال دارای یک محتوی می‌باشد. مانند کتاب، پایان‌نامه، گزارش، قرارداد، نقشه و غیره. تشخیص نوع محتوی با کارشناس منابع دیجیتال می‌باشد و تصمیم‌گیریهای وی فهرست انواع محتوای منابع دیجیتال یک مرکز را تعیین می‌نماید. محتوی، مفهومی مستقل از قالب خاص می‌باشد. به عنوان مثال یک منبع دیجیتال با قالب JPG می‌تواند حاوی یک اثر نقاشی و یا یک کتاب نسخه خطی اسکن شده باشد. تعیین محتوای منبع دیجیتال بر اساس سیاستگذاری‌های کتابخانه انتخاب می‌گردد. محتوی منبع دیجیتال قابل استخراج خودکار نبوده و باید ورود اطلاعات دستی شود. بسته به نوع سیاست‌گذاری هر مرکز، ضرورت دارد که فهرست انواع محتوی منابع دیجیتال مطابق نیاز مرکز ویرایش گردد. (تعریف و ویرایش انواع محتوا)

جهت درک بهتر مفهوم محتوی و قالب منابع دیجیتال به تصویر زیر دقت فرمایید.


مثال قالب و محتوی در کتابخانه دیجیتال