بايگانی‌ وب‌نوشت

Big Data

من اسفند ماه سال کذشته در همایشی شرکت داشتم تو دانشگاه آزاد واحد تهران جنوب که توسط انجمن علمی این دانشکده (که روزی خودم دبیرش بودم!) برگزار شده بود، و به معرفی محصولات جدید مایکروسافت می پرداخت. تو این همایش من علاوه بر شنونده، سخنران هم بودم و در مورد ویژگی های جدید SQL Server تو نسخه 2012 صحبت کردم و بخشی از صحبت رو هم به Big Data اختصاص دادم.

bigdataدر حال حاضر فقط به طور خلاصه یه تعاریفی ازش تو این مطلب به همراه چند تا مطلب مفید مرتبط به شما ارائه می کنم، تا بعد در فرصت مناسب بیشتر بنویسم در این مورد.

حرف اصلی Big Data از منظر کسب و کارها این که بشه از حجم زیاد داده های تولید شده، برای بهبود و رونق کسب و کار و یا بهتر کردن زندگی جمعی استفاده کرد. از منظر پیاده سازی هم باید به دنبال ابزارهایی بود که بشه تو مدت زمان کم، حجم زیادی از داده ها رو پردازش کرد و ازشون اطلاعات ارزشمند برای تحلیل ها به وجود اورد.

یکی از نمونه هاش، داده های حاصل از کنش های کاربرا تو  شبکه های اجتماعی که پردازش و دسته بندی شون می تونه کسب و کارها رو تو پیدا کردن مشتری ها و فروش محصولات و خدمات شون کمک کنه، یا داده های محیط زیستی که برای پیش بینی اینده به کار بر.

برای آشنا شدن با کاربردهاش این مطلب رو بخونید:

http://www.cio.com/slideshow/detail/92712/10-Real-World-Big-Data-Deployments-That-Will-Change-Our-Lives#slide1

و برای آشنا شدن با یکی از بستر های open source پردازش big data پیشنهاد می کنم Hadoop رو جست و جو کنید یا مطلب زیر رو بخونید

http://www.drdobbs.com/database/hadoop-the-lay-of-the-land/240150854

Advertisements

جایگاه NoSQL در دنیای امروز توسعه نرم افزار

قبل تر در دو مقاله  به معرفی NoSQL و نمونه هایی از آن که در .NET قابل استفاده هستند، پرداخته بودم. در این مقاله که از مجله ی ماهانه ی سایت Dr Dobbs برای شما ترجمه کردم، جایگاه این نوع از  دیتابیس را از منظر دیگه ای بررسی می کنم.

بابک فخریلو

یک از موضوعات بحث برانگیزی که حول NoSQL در بین توسعه دهندگان و معماران سیستم در جریان است، این است که بهترین جا برای استفاده از این نوع دیتابیس ها، کجاست. باور به بعضی فناوری ها، زمان زیادی را می طلبد. به عقیده برخی از توسعه دهندگان، NoSQL برای برنامه های کاربردی خاصی می تواند مفید باشد و دیتابیس های از نوع RDBMS همچنان چیرگی گذشته خود را حفظ خواهند کرد. چنین بحث هایی مانع از تغییرات بنیادین در چگونگی توسعه ی برنامه های کاربردی می شود. باهم چند ویژگی اساسی NoSQL را بررسی می کنیم تا ببینم تاثیر آن بر شکل دهی معماری برنامه های کاربردی در آینده و حتی حال حاضر چگونه خواهد بود.

بسط پذیری و Big Data

دیگر بحث بر سر داده هایی با چندین گیگابایت نیست، حتی برنامه های با اندازه کوچک هم با ترابایت یا پتابایت سر و کار دارند، که بیشتر این حجم از داده به طور مدوام در حال تغییر و رشد کردن است. هرچه بار داده ای بیشتر می شود، سازمان های IT محور به دنبال راهی خواهند بود که به سرعت سیستم خود را، بدون پرداخت صدهاهزار دلار برای خرید یک سرور، بسط و توسعه دهند.

دیتابیس های NoSQL برای چنین نیازی هایی راه حل ارائه می  دهند، چرا که طوری طراحی شده اند تا اصلاحا scale out شوند و نه scale up. این دیتایس ها با عملکرد خودکار روی چندین سرور ارزان قیمت یا روی بستر cloud، امکان افزایش و کاهش ظرفیت را با هزینه ای مقرون به صرفه فراهم می کنند. شما بدون نیاز به پرداخت هزینه های بالا، سیستمی با عملکرد فوق العاده خواهید داشت.

از انجایی که محدودیت بسط پذیری این دیتابیس ها کم است، در مدیریت حجم داده های زیاد، که نیاز برنامه های امروز است، بسیار بهتر عمل می کند.

تغییر معماری سیستم

با ظهور سیستم های Cloud، شکل گیری سیستم های نرم افزاری هم به شکل قابل توجهی دچار تحول شده است، و این تغییر با بروز انواع جدیدی از فناوری ها و سرورها، ادامه خواهد داشت. یک instance از دیتابیس می تواند خیلی ساده  در هزاران node پخش شود، که این node ها هم در سرتاسر دنیا پراکنده شده اند، و به میلیون ها کاربر در سرتاسر دنیا به طور همزمان سرویس می دهند.

NoSQL به طور ذاتی با معماری سیستم های جدید تطابق دارد، یعنی طوری طراحی شده که در node های بیشماری بسط پیدا می کند و با اضافه و کم شدن یک node، همچنان به عملکرد خود ادامه می دهد. این شکل از  طراحی، هزینه های بسط سیستم و نیز مدیریت سیستم (system administration) را کاهش می دهد. خیلی از دیتابیس های NoSQL حتی قابلیت location-aware را نیز دارند، یعنی بسته به محل جغرافیایی کاربر، سرعت ارائه داده ها می تواند افزایش پیدا کند (مانند انچه در Content Delivery Network ها وجود دارد).

سادگی استفاده

از آنجایی که این دیتابیس ها، برخلاف RDBMS، schema ی ثابت ندارند، کار کردن با آنها ساده است. شما می توانید خیلی سریع برنامه ی خود را اماده کنید، بدون این که نگران باشید به خاطر تغییر در سیستم نرم افزاری تان، مجبور به سپری کردن زمان برای تغییر schema باشید. به اضافه این که خاصیت document-oriented بودن این دیتابیس ها، نیاز به تبدیل پرس و جوهای SQL به کد object-oriented (انچه که ORM ها انجام می دهند)، و برعکس را، برطرف می کند. خوب با این توضیحات آیا NoSQL جایگزین RDBMS خواهد شد؟ پاسخ این است که نه به این زودی ها. باید چشم انتظار آینده بود…آینده ای نزدیک البته

برگرفته از:

Why NoSQL Is Here To Stay

بیشتر بخوانید:

NoSQL چیست؟

RavenDb