۷۵ درصد صفحات وب فارسی بی ارزش هستند

14:38 ۳۸۱ روز و ۷ ساعت پیش ایتنا 4,345 0
۷۵ درصد صفحات وب فارسی بی ارزش هستند

ایتنا - در میان ۴ میلیارد صفحه فارسی شناسایی شده نزدیک به ۱ میلیارد آن‌، یعنی چیزی در حدود ۲۵ درصد، ارزشمند است.

ایتنا

مدیر اجرایی یک موتور جستجوگر با بیان این که ۷۵ درصد صفحات وب فارسی بی‌ارزش هستند گفت: در میان ۴ میلیارد صفحه فارسی شناسایی شده نزدیک به ۱ میلیارد آن‌، یعنی چیزی در حدود ۲۵ درصد، ارزشمند است.به گزارش ایتنا از تسنیم، امیرعلی خیراندیش با اعلام این خبر افزود: این جویشگر به کمک نسخه جدید فنی خود، توانسته است به رکورد تحت پوشش قراردادن ۴ میلیارد صفحه وب فارسی برسد که در مقایسه با رقم ۲ میلیارد در مدت مشابه سال پیش، نشان از افزایش ۱۰۰ درصدی میزان پوشش نسخه جدید این جستجوگر است.وی با اشاره به اینکه ۷۵ درصد صفحات وب فارسی بی‌ارزش هستند افزود: در میان ۴ میلیارد صفحه فارسی شناسایی شده توسط این جستجوگر، نزدیک به ۱ میلیارد آن‌، یعنی چیزی در حدود ۲۵ درصد، ارزشمند بوده و بقیه صفحات تکراری یا اسپم بوده‌ است که نشان از ضعف تولید محتوی در زبان فارسی دارد.او پیشنهاد کرد: با توجه به روندهای جهانی در مسئله تولید محتوی، افراد جامعه در هر شغل یا حرفه ای که هستند، می‌توانند باتوجه به دانسته‌های علمی و کاربردی خود، به تولید محتوی معتبر و موثق در راستای آگاهی‌رسانی تخصص خود اقدام کنند که البته این مبحث باعث توسعه کسب‌و‌کار آنها نیز خواهد شد.خیراندیش با بیان اینکه حجم بالای صفحات بی‌ارزش، دو چالش بزرگ را پیش روی پارسی جو در پوشش صفحات وب فارسی قرار داده است افزود: این جستجوگر ملی برای کشف صفحات وب مفید فارسی باید تعداد زیادی از صفحات را شناسایی کند در حالی که تنها ۲۵ درصد آنها قابل استفاده برای کاربران است که همین عامل علاوه بر اتلاف زمان، فشار زیادی بر سرورها وارد می‌کند، ضمن اینکه موتور جستجوی ما برای حفظ و ارتقای کیفیت خود، ملزم به ارتقای مداوم هوش مصنوعی خود در بخش خزش، نمایه‌سازی و رتبه‌بندی است.مدیراجرایی این جویشگر بومی ادامه داد: به‌کارگیری فناوری‌های نوین، درک صحیح از زبان فارسی، تکنیک‌های موثر در حذف صفحات تکراری و اسپم و رعایت‌ تناسب‌های فرهنگی از جمله ویژگی‌های بی‌بدیل جستجوگر پارسی جو و تسلط آن در حوزه وب فارسی است.وی در پایان افزود: استفاده بیش از ۱۵ سرویس متنوع برای ارتقاء کیفیت نتایج جستجو، پوشش ۴ میلیارد سند فارسی، قدرت پاسخ‌گویی به میلیون‌ها پرس‌و‌جو در روز ، استفاده از خزشگر هوشمند با پوشش میلیاردها سند از جمله ویژگی‌های جستجوگر ملی پارسی جو است.


گروه های زیر مجموعه فناوری اطلاعات

روبوتيك
روبوتيك
وب و اينترنت
وب و اينترنت
امنيت
امنيت
اينترنت
اينترنت
ويروس
ويروس
سخت افزار
سخت افزار
موبايل
موبايل
مخابرات
مخابرات
اپراتورها
اپراتورها
بانكداری الكترونيك
بانكداری الكترونيك
شبكه اجتماعي
شبكه اجتماعي
برنامه نويسي
برنامه نويسي
اخبار داخلی
اخبار داخلی
بازی
بازی
وب ايراني
وب ايراني
لوازم جانبی
لوازم جانبی
ميزباني وب
ميزباني وب
تجارت الكترونيك
تجارت الكترونيك
سيستم عامل
سيستم عامل
مديريت ICT
مديريت ICT
ماهواره و فضا
ماهواره و فضا
قطعات
قطعات
 نرم افزار
نرم افزار
فناوری شخصی
فناوری شخصی
كامپيوتر همراه
كامپيوتر همراه
شبكه و امنيت
شبكه و امنيت
تنظيم مقررات
تنظيم مقررات

پر بازدید ترین اخبار امروز

روزهای نا آرام در راه است- پیشخوان
منتخب تصاویر صفحات نخست روزنامه‌های چهارشنبه ۲۷ دی منتشر می‌شود.
اکبر عبدی؛ سلطان کمدی ایران
دوران بازیگری اکبر عبدی زمانی آغاز شد که دوران بازیگران بسیاری به پایان رسیده بود و سینمای ایران در برنامه‌ریزی دولتی‌اش برای ابراز وجود و تثبیت موقعیت به کمیت بیش از کیفیت احتیاج داشت.
فیلم مستند، فرزند ناتنی سینمای ایران؟!
فیلم مستند فرزند ناتنی سینما نیست. در ایران نگاه به سینمای مستند با بی مهری های زیادی همراه بوده است، اما چه کانون اصلی مستند را تلویزیون بدانیم و چه ندانیم، آثار مستندی وجود دارند که برای پرده سینما ساخته شده اند.
ساز کوک گروه‌ها در جشنواره موسیقی فجر
موسیقی، آب است؛ گذرا، مواج، آرامش بخش، خروشان. سیراب می کند. موج بر می دارد و تو را همراه می برد. غرقه ات می کند. به خروش می آید و پاشان، نفس بندت می سازد. موسیقی، آب است، نه قلمرو می شناسد، نه مرز. بی صدا به تن خاک می نشیند و به زبان نرم، سنگ را هم مغلوب می کند.