معرفی و آموزش نرم‌افزار ScientoPy

سه شنبه, ۱۲ شهریور ۱۳۹۸، ۱۲:۱۵ ب.ظ

چند وقت پیش با نرم‌افزار ScientoPy از طریق مقاله‌ای که طراحانش در مجله ساینتومتریک منتشر کرده بودند آشنا شدم. این نرم‌افزار قابلیت‌های زیادی در مصورسازی مجموعه‌ مقالات داره و از این رو میتونه برای کسایی که قصد بررسی مجموعه‌ای از مقالات رو دارند، مثلا افرادی که میخوان در هنگام نگارش مرور نظام‌مند، یک مرور اجمالی از مجموعه‌شون داشته باشند میتونه مفید باشه. کار با این نرم‌افزار بسیار ساده هست و در دو نسخه بدون رابط کاربری و با رابط کاربری عرضه شده. در ادامه مطلب به آموزش این نرم‌افزار می‌پردازیم.

آموزش نرم‌افزار ScientoPy

آموزش نصب

همونطور که از اسم این نرم‌افزار میشه فهمید، ساینتوپای به زبان پایتون نوشته شده و برای اجرای اون باید ابتدا پایتون رو روی سیستمتون نصب کنید.

1- برای نصب پایتون، به سایت پایتون مراجعه کنید و جدیدترین نسخه از پایتون ورژن 3 رو دانلود کنید.

2- در هنگام نصب پایتون توجه داشته باشید که تیک “Add Python 3.7 to PATH” رو مطابق تصویر زیر فعال کنید.

3- اگر میخواید که ساینتوپای براتون ابر واژگانی از مجموعه مقالات رو بسازه، نیاز هست که Microsoft Visual C++ Redistributable for Visual Studio 2017 رو هم نصب کنید. برای نصب این مجموعه اینجا کلیک کنید (حجمش زیاده، حدود 4 گیگابایت. اگه ترسیم ابر واژگانی زیاد براتون مهم نیست از خیرش بگذرید).

4- حالا باید کتابخونه‌هایی که ساینتوپای ازشون استفاده میکنه رو روی پایتون نصب کنید. برای اینکار در ویندوز دکمه win+r رو فشار بدید تا صفحه Run باز بشه و بعد توی اون cmd رو تایپ و اینتر بزنید.

win+r

با این کار صفحه فرمان ویندوز براتون باز میشه، در این صفحه کد زیر رو تایپ کنید و اینتر بزنید تا کتابخونه‌های لازم نصب بشن.

python -m pip install --user unidecode numpy scipy matplotlib wordcloud

5- حالا آخرین نسخه از ساینتوپای رو از این لینک دانلود کنید.

کار با نرم‌افزار

1- دانلود دیتا

اول باید دیتای مورد نظرتون رو از طریق WoS و یا Scopus دانلود کنید. بدین منظور استراتژی جستجوی مورد نظرتون رو در این پایگاه‌ها اجرا کنید.

برای خروجی گرفتن از پایگاه wos باید مطابق تصویر زیر در لیست نتایج جستجو روی دکمه Save in Other File Formats کلیک کنید.

و در صفحه جدیدی که باز میشه تعداد رکوردهایی که میخواید دانلود کنید رو وارد کنید و نوع محتوای دانلودتون رو روی Full Record and Cited References و فرمت فایل رو روی Tab-delimited (Win, UTF-8) تنظیم کنید.

نکته: اگر لیست نتایج جستجوی شما بیشتر از 500 رکورد باشه، باید بصورت فایل های جداگانه 500 تایی دانلود کنید. یک بار از 1 تا 500، بار بعد از 501 تا 1000 و ...

برای گرفتن خروجی از اسکوپوس هم در لیست نتایج روی Export کلیک کنید.

و بعدش فرمت CSV (Excel) رو انتخاب و مطابق تصویر زیر، داده های مورد نیاز رو انتخاب کنید.

حالا شما دو یا چند فایل از نتایج جستجوتون دارید که میتونید ازشون برای تحلیل‌های بعدی استفاده کنید. این فایل‌ها رو در یک فولدر قرار بدید و اون رو در فولدر نرم‌افزار ساینتوپای که دانلود کردید قرار بدید. من این فایل‌ها رو در فولدر ScientoPy/dataIn/ قرار دادم

اجرای پیش پردازش

ما الان دو یا چند فایل داریم که از دو پایگاه اطلاعاتی مختلف گرفتیم. معلومه که نمیتونیم مستقیما باهاشون کار کنیم. برای اینکار ساینتوپای ابتدا یک سری فعالیت‌های پیش پردازشی رو انجام میده که این فایل‌های مختلف رو با هم ترکیب، و موارد تکراری رو حذف کنه.

برای این کار ابتدا خط فرمان رو اجرا کنید و با کد زیر، وارد فولدر ساینتوپای بشید. من ساینتوپای رو توی دسکتاپم ریختم و از مسیر زیر استفاده میکنم. شما اگر در جای دیگه‌ای ریختید باید مسیر فولدر ساینتوپای خودتون رو وارد کنید.

cd C:\Users\your_username\Desktop\ScientoPy

حالا باید پایتون رو فراخوانی کنید و دستور پیش پردازش داده هایی که در فولد dataIn هستند رو اجرا کنید:

python preProcess.py dataIn

بعد از اجرای دستور فوق، یه نمودار برای شما نشان داده میشه که درش تعداد مدارک هر کدوم از پایگاه ها و میزان مدارک تکراری رو نشون میده:

استخراج اطلاعات

خب الان داده‌ها آماده اجرای تحلیل‌های ما هستند. حالا با اجرای کد scientoPy.py -c و ترکیبش با تگ‌های زیر، میتونید برترین‌های هر کدوم از تگ‌ها رو مشاهده کنید.

author ===>Authors last name and first name initial
sourceTitle ===>Publication or journal name
subject ===>Research areas, only from WoS documents
authorKeywords ===>Author keywords
indexKeywords ===>Keywords generated by the index, from WoS {Keyword Plus}, and from Scopus { Indexed keywords}
bothKeywords ===>AuthorKeywords and indexKeywords are used for this search
abstract ===>Document abstract, for use with pre-defined topics and asterisk wildcard
documentType ===>Type of document
dataBase ===>Database where the document was extracted (WoS or Scopus)
country ===>Country extracted from authors affiliations
institution ===>Institution extracted from authors affiliations
institutionWithCountry ===>Institution with country extracted from authors affiliations

به عنوان مثال، با اجرای کد زیر، میتونید 10 نویسنده برتر در مجموعه‌تون رو مشاهده کنید:

python scientoPy.py -c author

نکته: بصورت پیشفرض 10 مورد برتر از موارد فوق بشما نشان داده میشه. اگه به تعداد بیشتری نیاز دارید باید بوسیله دستور l- تعداد مورد نظرتون رو وارد کنید. مثال: 30 کشور برتر:

python scientoPy.py -c country -l 30

امکان مصورسازی دستورهای شما به وسیله انواع دیگر گراف‌ها هم وجود داره. این گراف‌ها عبارتند از:

Time line==> -g time_line
Horizontal bars==> -g bar
Evolution==> -g evolution
Word cloud==> -g word_cloud

به عنوان مثال، کد زیر 10 کلیدواژه برتر رو در گذر زمان بهتون نشون میده:

python scientoPy.py -c authorKeywords -g time_line

این نرم‌افزار قابلیت‌هایی هم برای تحلیل موضوعات بهتون میده که می‌تونید با مشاهده این مقاله که نمونه‌ای از این تحلیل‌هاست ازش برای کار خودتون ایده بگیرید.

۱ ۰
۹۸/۰۶/۱۲

محمد جواد منصورزاده

بلاگ شخصی محمدجواد منصورزاده

بلاگ شخصی محمدجواد منصورزاده

Mohammad Javad Mansourzadeh

معرفی و آموزش نرم‌افزار ScientoPy

آموزش نرم‌افزار ScientoPy

آموزش نصب

کار با نرم‌افزار

1- دانلود دیتا

اجرای پیش پردازش

استخراج اطلاعات

ScientoPy

Scientometrics

تحلیل موضوعی

ساینتوپای

سیستماتیک ریویو

علم‌سنجی

مرور نظام‌مند

معرفی نرم‌افزار

نظرات (۱)

ارسال نظر

محمد جواد منصورزاده
دکتری کتابداری و اطلاع‌رسانی پزشکی
دانشگاه علوم پزشکی تهران

علم داده

علم‌سنجی

معرفی پادکست

علم باز

معرفی کتاب

پژوهش

مقالات من

مدیریت داده‌های پژوهشی

بلاگ شخصی محمدجواد منصورزاده

Mohammad Javad Mansourzadeh

آموزش نرم‌افزار ScientoPy

آموزش نصب

کار با نرم‌افزار

1- دانلود دیتا

اجرای پیش پردازش

استخراج اطلاعات

ScientoPy

Scientometrics

تحلیل موضوعی

ساینتوپای

سیستماتیک ریویو

علم‌سنجی

مرور نظام‌مند

معرفی نرم‌افزار

نظرات (۱)

ارسال نظر

محمد جواد منصورزاده دکتری کتابداری و اطلاع‌رسانی پزشکی دانشگاه علوم پزشکی تهران

علم داده

علم‌سنجی

معرفی پادکست

علم باز

معرفی کتاب

پژوهش

مقالات من

مدیریت داده‌های پژوهشی

محمد جواد منصورزاده
دکتری کتابداری و اطلاع‌رسانی پزشکی
دانشگاه علوم پزشکی تهران