إذا كنت تعمل مع مجموعات بيانات أكبر في جداول بيانات Google ، فقد تكون مقارنة القيم المتغيرة عملية شاقة. لحسن الحظ ، يعد التطبيع طريقة إحصائية ستساعدك على فرز القيم المعقدة إلى مجموعات بيانات سهلة المقارنة.
تشرح هذه المقالة ماهية التطبيع وكيف يمكنك تسوية البيانات في جداول بيانات Google للحصول على مزايا إحصائية.
كيفية تطبيع البيانات في جداول بيانات Google
افترض أن لدينا بعض القيم العددية في الخلايا التي تتراوح من A2 إلى A50. لتسوية هذا النطاق إلى قيم بين X و Y ، إليك ما عليك القيام به:
(Y-X) * ((A2-MIN ($ A $ 2:$ A $ 50)) / (MAX ($ A $ 2:$ A $ 50) -MIN ($ A $ 2:$ A $ 50))) + Y
استخدم القيم العددية لـ X و Y مباشرة.
تعد تسوية بياناتك طريقة رائعة لقياس الاختلافات بين مجموعتي بيانات بقيم دنيا وقيم مختلفة.
كيفية استخدام جداول بيانات Google كقاعدة بيانات
كل قاعدة بيانات هي في الأساس جدول كبير (أو العديد من الجداول المتصلة) ، يحكمها نظام إدارة قاعدة البيانات. إذا كنت تعمل باستخدام مجموعة بيانات صغيرة نسبيًا لا تحتاج إلى توسيع نطاقها كثيرًا ، فيمكن استخدام جداول بيانات Google كقاعدة بيانات.
إذا كنت تريد البدء في استخدام جداول بيانات Google كقاعدة بيانات ، فستحتاج إلى الحصول على خلفية في البرمجة الأساسية. ستحتاج أيضًا إلى واجهة برمجة تطبيقات لجعل الورقة متوافقة مع SQL و Python. بينما تقدم Google واجهة برمجة تطبيقات شاملة لخدماتها ، فقد يكون التعامل معها أكثر من اللازم. لذلك ، نوصي بـ sheet2api أو Autocode لحل حاجة API. ستوفر خدمات واجهة برمجة التطبيقات الاتصال والمصادقات اللازمة لربط جداول بيانات Google الخاصة بك كقاعدة بيانات لديك وتقديم نقاط نهاية كافية لتمكين سير عمل قاعدة البيانات المناسب.
تتمثل الفائدة الرئيسية لاستخدام جداول بيانات Google كقاعدة بيانات في أنه يمكنك دائمًا الحصول على نظرة عامة مرئية لجميع البيانات. نظرًا لأن Google Sheets متاح كتطبيق للأجهزة المحمولة ومتوافق مع معظم المتصفحات وأنظمة التشغيل ، يمكن الوصول إلى قاعدة البيانات الخاصة بك من أي مكان في العالم. يمكنك أيضًا استعراض البيانات وتحريرها مباشرةً في الورقة نفسها ، بدلاً من استخدام التعليمات البرمجية لتشغيل استعلام من خلال قاعدة البيانات لإجراء تغييرات.
ومع ذلك ، فإن Google Sheets لها قيودها على إدارة قواعد البيانات. أولاً ، هناك نقص واضح في الوظائف العلائقية. تتكون قواعد البيانات عادةً من العديد من الجداول التي تستخدم مفاتيح خارجية للتواصل مع بعضها البعض ، وهي عملية لا توجد ببساطة في جدول بيانات واحد.
إذا كنت تريد إلقاء نظرة على مثال ، ففكر في الأقسام في شركتك. في جدول البيانات ، عادةً ما تكون هذه السلاسل عبارة عن سلاسل مكتوبة فقط. ومع ذلك ، هذا ليس من الحكمة لمجموعة أكبر من البيانات. في قواعد البيانات ، سيكون لديك جدول منفصل لأقسام الشركة ، مع ترقيم كل قسم وفقًا لذلك. يمكنك بعد ذلك الرجوع إلى رقم القسم في البيانات المتعلقة بالموظف باستخدام مفتاح خارجي. يسمح لك وجود جدول قسم منفصل بإجراء تغييرات مباشرة على الأقسام نفسها دون إجراء التغييرات من خلال قاعدة البيانات بأكملها.
بالإضافة إلى ذلك ، يمكن لـ Google Sheets تخزين خمسة ملايين خلية فقط في المرة الواحدة. على الرغم من أن هذا قد يبدو عددًا كبيرًا ، إلا أنه حتى الشركات متوسطة الحجم يمكن أن يكون لديها قواعد بيانات تتجاوز هذا الحد. علاوة على ذلك ، ستصل إلى مشكلات الأداء بشكل أسرع قبل أن تصل إلى حد الخلية. مع وجود مقياس خطي على ما يبدو بين عدد الخلايا والأداء ، سيكون لديك تأخيرات كبيرة عند العمل مع قاعدة بيانات تحتوي على 100 ألف خلية.
أسئلة شائعة إضافية
هل يمكنك إدراج البيانات في جداول بيانات Google؟
تسمح لك واجهة برمجة التطبيقات المدمجة في Google بإدراج جدول مباشرة من الملفات. تدعم أداة استيراد الملفات الامتدادات التالية:
• .xls
• .xlsx
• .xlsm
• .xlt
• .xltx
• .xltm
• .ods
• .csv
• .txt
• .tsv
• .tab
بالإضافة إلى ذلك ، عادةً ما تتكامل برامج الجهات الخارجية مع جداول بيانات Google. يحتوي كل من Sheets2api و Autocode ، اللذين ناقشناهما سابقًا ، على حلول واجهة برمجة التطبيقات لتوفير إمكانية إدراج البيانات في الجداول الحالية.
يمكنك أيضًا استخدام وظيفة IMPORTRANGE لإدراج البيانات من ورقة Google إلى أخرى.
لدى Google أيضًا تعليمات البرمجة النصية لكتابة المحتوى في جدول بيانات.
إذا تمكنت من العثور على حل API يناسبك ، فيمكنك بسهولة إدراج البيانات في جداول بيانات Google بمجرد توصيلها بنظامك الأساسي.
كيف يمكنني تنظيف البيانات في جداول بيانات Google؟
تقدم جداول بيانات Google العديد من الحلول لتنظيف البيانات وفرزها.
إذا كنت تستخدم نماذج Google لجمع نتائج الاستطلاع ، فيمكنك إعداد النماذج للصق الردود تلقائيًا في جدول بيانات ، بدلاً من لصق البيانات يدويًا.
تحتوي جداول بيانات Google أيضًا على ميزة التحقق من صحة البيانات. إذا انتقلت إلى البيانات> التحقق من صحة البيانات ، يمكنك إعداد ميزات التحقق من الصحة لمنع القيم غير الصحيحة. على سبيل المثال ، يمكنك عمل قائمة بالعناصر التي يمكن وضعها في عمود معين ، وستؤدي محاولة إدراج أي شيء آخر إلى حدوث خطأ.
تحتوي جداول بيانات Google أيضًا على خياري "إزالة التكرارات" و "اقتطاع المسافة البيضاء". سيؤدي هذا إلى إزالة أي قيم إضافية ومسافات بيضاء من صفوفك وخلاياك.
إذا كنت ترغب في لصق المزيد من البيانات المنظمة من الصفحات عبر الإنترنت ، فاستخدم IMPORTHTML أو IMPORTXML للحصول على المعلومات التي تحتاجها من صفحة ويب ، بدون الفوضى الإضافية.
ماذا يعني تطبيع البيانات؟
في الإحصائيات ، سيسمح لك تطبيع البيانات بجعل مجموعات البيانات المتنوعة أكثر قابلية للمقارنة.
عند تسوية البيانات ، يمكنك تغيير نطاق القيمة الرقمية الأصلية إلى نطاق من اختيارك. على سبيل المثال ، يمكنك تسوية طرق تسجيل الدرجات المختلفة في نفس نطاق القيمة لمقارنتها ببعضها البعض.
تتم تسوية قيمة س التي تأتي من نطاق (ص ، ض) إلى نطاق (أ ، ب) بالصيغة التالية:
X_normalized =(b - a) * ((x - y) / (z - y)) + a
تعد تسوية البيانات مفيدة عندما لا تحتوي مجموعات البيانات الأصلية على قيم نظيفة. على سبيل المثال ، يمكن أن يساعد توحيد النطاقات إلى (0،100) في توفير نظرة عامة سريعة على النتائج بشكل مستقل عن الحد الأقصى لقيمة الدرجات نفسها.
طريقة إحصائية إضافية في تقييم البيانات هي التوحيد. هذا يضع القيم الرقمية الأصلية ليكون لها متوسط 0 وانحراف معياري 1. غالبًا ما تسمى القيم الموحدة درجات z.
تحتوي جداول بيانات Google على وظيفة تسمح لك بتوحيد مجموعة البيانات. ستضع الدالة STANDARDIZE (x، mean، standard_dev) القيمة العددية ، x ، في شكلها القياسي. يمكنك استخدام الدالة AVERAGE (النطاق) للحصول على متوسط قيمة بياناتك في الجدول واستخدام وظيفة ST_DEV (النطاق) لحساب الانحراف المعياري لمجموعة البيانات.
يختلف تفسير البيانات الموحدة قليلاً. على سبيل المثال ، الرقم القياسي -1.5 يعني أن القيمة الأصلية أصغر من المتوسط بمقدار 1.5 مرة الانحراف المعياري للمجموعة.
يمكن أن يكون التوحيد القياسي مفيدًا لمقارنة قيم مجموعات البيانات المختلفة بتوقعات ووسائل مختلفة. نظرًا لأن التوحيد يضع دائمًا المتوسط على 0 والانحراف إلى 1 ، فإن القيم الفعلية المقدمة في مجموعة البيانات لن تتداخل مع المقارنة.
يمكن للتحليل الإحصائي أيضًا تحويل مجموعة بيانات لتناسب توزيعًا معينًا ، ولكن هذه ميزة إحصائية متقدمة لن يتم تناولها في هذا الدليل.
عادي جديد
تعد تسوية مجموعات البيانات أداة مفيدة للغاية في تحليل البيانات ، وتوفر جداول بيانات Google حلاً سريعًا لتطبيع البيانات الرقمية. علاوة على ذلك ، يمكنك استخدام جداول بيانات Google كقاعدة بيانات صغيرة ، إذا كنت لا تعمل بكميات غير عادية من مجموعات البيانات لعملك. عمليات التكامل التي تمتلكها جداول بيانات Google مع برامج الجهات الخارجية تجعلها مناسبة لمجموعة واسعة من الصناعات. ومع ذلك ، ستكون قواعد البيانات المناسبة أكثر قابلية للتوسع.
ما نوع المعلومات التي تطبعها عادةً في جداول بيانات Google؟ هل تستخدم جداول بيانات Google لقاعدة بياناتك؟ أخبرنا في قسم التعليقات أدناه.