مفاهیم آرشیو منابع دیجیتال
ضرورت گذر کتابخانه ها از ساختارهای سنتی به ساختار دیجیتال
کتابخانهها و مراکز اسناد علاوه بر نگهداری اصل منابع خود به دو دلیل نیازمند نگهداری فرم دیجیتال آنها نیز هستند.
دلیل اول گرانبها بودن منابع کتابخانه و یا در مواردی، نفیس بودن منابع (نسخ سنگی و خطی) میتواند محدودیتهای زیادی را برای استفاده از منابع ایجاد نماید و کتابخانهها میتوانند با ارائه فرم رایانهای، مقدار قابل توجهی از نیاز مراجعین را برطرف کنند.
دلیل دوم نیاز به دسترسی از راه دور (از طریق اینترنت) به منابع و مدارک میباشد که جز با تبدیل آنها به فرم رایانهای امکانپذیر نمیباشد.
مفهوم منبع دیجیتال
عبارت منبع دیجیتال ترجمه Digital Resource است. منبع دیجیتال، فرمی از یک اثر کتابشناختی میباشد که به منظور استفاده توسط رایانه تهیه شده است. در زبان انگلیسی از عبارات دیگری نظیر Computer File یا Electronic Resource نیز برای همین مفهوم استفاده میشود. یک منبع دیجیتال حتما باید درون یک حامل قرار گیرد تا بتوان به صورت مستقیم و یا از راه دور به منبع دیجیتال دسترسی پیدا کرد.
طبق این تعریف، فایلهای رایانهای مثلا با فرمت PDF و DOC و همچنین فایلهای حاوی اطلاعات پایگاه داده و یا سایر فایلهای رایانهای که برای مشاهده محتویات آنها نیاز به نرمافزار میباشد، جزء منابع دیجیتال محسوب میشوند. در حال حاضر تقریبا هر نوع مدرک کتابشناختی را میتوان به یک یا چند فرمت مناسب از فایلهای رایانهای تبدیل کرده و در حافظههای رایانه ذخیره کرد.
چگونگی تولید و گردآوری منابع دیجیتال
نوع اول، نسخه دیجیتال شده یک اثر کتابشناختی و چاپی میباشد.
به طور مثال کتاب الکترونیکی (EBook)، پایاننامههای دانشجویی با فرم فایل MS Word، فایل حاصل از Scan یک عکس به فرم TIFF و یا نامههای وارده و صادره، قراردادها، فاکتورها و ...که حاصل اسکن از نسخه چاپی موجود در بایگانی هستند.
نوع دوم، فایلهای رایانهای که لزوما ما به ازای فیزیکی یا کتابشناختی ندارند.
به طور مثال عکسهای گرفته شده توسط یک دوربین دیجیتال با فرم فایل JPG، فایل سخنرانی ارائه شده در یک همایش به فرم PPT، فایل حاصل از Scan یک صفحه از یک کتاب با فرم TIFF
مفهوم دستهبندی درختی و ساختار کد
استفاده از ساختار درختی برای نگهداری منابع دیجیتال، این امکان را بوجود آورده است که همزمان با نگهداری خود منابع دیجیتال، یا آدرس درون پایگاه اطلاعات آنها، بتوان ارتباط منابع دیجیتال با یکدیگر را نیز ثبت و نگهداری کرد. ساختار درختی منابع دیجیتال، همزمان با ورود اطلاعات منابع شکل می گیرد. در واقع، منابع دیجیتال تشکیل دهنده شاخه ها و برگهای درخت منابع دیجیتال هستند. هر منبع دیجیتال می تواند دارای زیرشاخه و یا فاقد زیرشاخه باشد. شاخههایی که در کنار یکدیگر قرار میگیرند، یک سطح را تشکیل می دهند. علاوه بر آن استفاده از کدینگ انعطافپذیر برای شمارهگذاری منابع دیجیتال در درخت، امکان شناسایی دقیق منبع دیجیتال را در آرشیو فراهم کرده است.
ویژگیهای درخت منابع دیجیتال در نرم افزار آرشیو نوسا
1. امکان ذخیره فایل یک منبع دیجیتال در هر سطحی از درخت وجود دارد. ماهیت سطوح درخت به گونهای است که هم میتواند حاوی فایل باشد و هم برای دستهبندی منابع دیجیتال مورد استفاده قرار گیرد.
2. سطوح درخت میتوانند دارای عمقهای متفاوتی باشند و محدودیتی برای یکسان بودن عمق درخت در بخشهای مختلف وجود ندارد.
3. امکان استفاده از سیستم کدینگ بسیار پیشرفته، برای شمارهگذاری منابع دیجیتال به نحوی که تعداد ارقام زیرگروه هر منبع دیجیتال به صورت اختصاصی قابل تعیین است.
به عنوان مثال در یک سطح میتوان یک منبع دیجیتال با زیرگروه 2 رقمی را در کنار یک منبع دیجیتال با زیرگروه 3 رقمی نگهداری کرد.
4. امکان نگهداری منابع دیجیتالی که به صورت ساده و تک فایل نیستند، بلکه دارای اجزای متعددی میباشند، در ساختار درختی براحتی میسر است. به عنوان مثال یک کتاب، دارای چند جلد و هر جلد، دارای چند فصل باشد.
5. امکان پیادهسازی شیوههای دستهبندی مناسب با ساختار مورد نیاز مرکز میسر است. مناسبترین شیوه دستهبندی برای آرشیو های کوچک و متوسط،دستهبندی محتوایی درخت منابع دیجیتال است. در آرشیوهای بزرگ، تعداد منابع دیجیتال بقدری زیاد است که امکان تفکیک محتوایی وجود ندارد و منابع با همان دستهبندی که وارد آرشیو میشوند در سیستم ذخیره می گردند.
مفهوم قالب منابع دیجیتال
قالب منبع دیجیتال بیانگر نوع فایل از نظر ساختاری است و معمولا قابل استخراج خودکار به کمک پسوند فایل میباشد. تعیین قالب جهت تعیین چگونگی رفتار نرمافزارها با فایل استفاده میشود.
قالب خاص
هر فایل دارای یک نام و یک مشخصه میباشد. مشخصه یا پسوند فایل که به آن Extention نیز میگویند، معمولاً سه حرفی است و نشاندهنده فرمت یا نوع فایل است. فرمت فایل یک روش استاندارد جهت نشان دادن ساختار فایل، به عنوان مثال باینری (Binary) یا اسکی (Ascii) میباشد. با استفاده از فرمت یک فایل، سیستم عامل میتواند فایل را متناسب با نوع آن اجرا و پردازش کند. فرمت یک فایل، از روشهای مختلفی قابل شناسایی است، یکی از این روشها که در سیستمعامل ویندوز استفاده میشود، شناسایی مشخصه یا پسوند فایل است.
نکته: پسوند فایل، الزاماً فرمت فایل را نشان نمیدهد. ممکن است با یک دستکاری ساده، پسوند فایل تغییر داده شود. به هرحال، بحث ما این استثناءها نمیباشد، همچنین ممکن است فایلی دارای هیچ پسوندی نباشد! در نرمافزار آرشیو و نگهداری منابع دیجیتال، هنگام افزودن منبع، قالب خاص به صورت خودکار از طریق پسوند فایل، استخراج میگردد. این عمل به شرطی قابل انجام است که قالب خاص آن فایل در فهرست قالبهای خاص، از قبل به نرمافزار معرفی شده باشد. (تعریف و ویرایش انواع قالبهای خاص)
قالب عام
منابع دیجیتال به پنج دسته کلی تقسیم میشوند که به این دستهها قالبهای عام گفته می شود، در واقع میتوان گفت قالبهای عام، نوعی دستهبندی قالبهای خاص بوده و به شرح زیر میباشند:
متن: تمام فايلهاي رايانهاي نظير DOC و PDF که به طور کلي براي ذخيره فرم رايانهای منابع متني نظير کتاب، مقاله، پاياننامه و ساير اسناد به کار مي روند.
عکس: تمام فايلهاي رايانهای نظير PNG ،JPG ، BMP و غيره که براي ذخيره فرم رايانهای عکس، پوستر و يا تصاوير اسناد به کار مي روند.
ماده شنیداری: تمام فايلهاي رايانهای نظير MP3، WAV و غيره که براي ذخيره فرم رايانهای موسيقي و يا مواد گفتاري نظير سخنراني به کار مي روند.
ماده دیداری: تمام فايلهاي رايانهاي نظير DIVX، AVI، MPEG و غيره که براي ذخيره فرم رايانهاي فيلم ها و تصاوير متحرک به کار مي روند.
فایل رايانهاي: ساير فايلهاي رايانهاي نظير فايلهاي نرمافزارهاي خاص مهندسي (به طور مثال Autocad) و يا هرگونه فايلهاي اطلاعاتي ديگر که جزء چهاردسته قبل نيستند.
نکته: قالبهای عام بهصورت پیش فرض در نرمافزار آرشیو و فروش نوسا تعریف شدهاند.
قالبهای عام تعریف شده در نرمافزار آرشیو و فروش نوسا را میتوان در شکل زیر مشاهده نمایید.
مفهوم محتوی منابع دیجیتال
هر منبع دیجیتال دارای یک محتوی میباشد. مانند کتاب، پایاننامه، گزارش، قرارداد، نقشه و غیره. تشخیص نوع محتوی با کارشناس منابع دیجیتال میباشد و تصمیمگیریهای وی فهرست انواع محتوای منابع دیجیتال یک مرکز را تعیین مینماید. محتوی، مفهومی مستقل از قالب خاص میباشد. به عنوان مثال یک منبع دیجیتال با قالب JPG میتواند حاوی یک اثر نقاشی و یا یک کتاب نسخه خطی اسکن شده باشد. تعیین محتوای منبع دیجیتال بر اساس سیاستگذاریهای کتابخانه انتخاب میگردد. محتوی منبع دیجیتال قابل استخراج خودکار نبوده و باید ورود اطلاعات دستی شود. بسته به نوع سیاستگذاری هر مرکز، ضرورت دارد که فهرست انواع محتوی منابع دیجیتال مطابق نیاز مرکز ویرایش گردد. (تعریف و ویرایش انواع محتوا)
جهت درک بهتر مفهوم محتوی و قالب منابع دیجیتال به تصویر زیر دقت فرمایید.