هل كل الكلمات متساوية في التكرار؟
إذا قمنا بإحصاء تكرار الكلمات في نص ما، بغض النظر عن طول النص، فسنحصل على نفس النتيجة. عدد قليل من الكلمات يتكرر كثيرا، وعدد كبير من الكلمات لا يتكرر كثيرا.
Table of Contents
Toggleعدد قليل من الكلمات يتكرر كثيرًا
تغطي الكلمات العشر الأكثر تكرارًا في اللغة الإنجليزية عادةً 25% من الكلمات في أي نص. وتغطي الكلمات المائة الأكثر تكرارًا حوالي 50%. على سبيل المثال، تغطي كلمة the بمفردها 7% من أي نص مكتوب باللغة الإنجليزية.
تغطي الكلمات الألف الأكثر تكرارًا حوالي 80% من الكلمات في معظم النصوص.
وبشكل عام اذا رغبت بتعلم الكلمات، فإنه من الجيد أن تبدأ بالكلمات الأكثر تكرارًا أولاً. لأنها ستقابلك في كثير من النصوص. و يرى المتخصصون في المفردات عادةً أن الكلمات الأكثر تكرارًا في اللغة الإنجليزية تتكون من حوالي 2000 إلى 3000 كلمة.
وعدد قليل فقط من هذه الكلمات هي كلمات وظيفية (كلمات مثلthe,a, of, it, that). تسمى كلمات محتوى وهي أسماء وأفعال وصفات وظروف.
عدد كبير من الكلمات لا يتكرر كثيرًا
نصف الكلمات في أي نص لن يظهر إلا مرة واحدة في ذلك النص. لذا، إذا قرأت رواية يبلغ طولها 100،000 كلمة ، فستواجه حوالي 5000 كلمة مختلفة. ونصف الكلمات المختلفة التي ستواجهها (أكثر من 2000 كلمة) ستظهر مرة واحدة فقط.
ولأن هذه الكمات لن تتكرر كثير ،بالتالي لن تتمكن من اكتسابها. وحتى اذا بحثت عنها في القاموس لدراستها، فقد تضطر إلى الانتظار لفترة طويلة قبل أن تصادفها مرة أخرى.
إن إحدى المهارات اللازمة لتعلم لغة ما، هي معرفة الكلمات التي تستحق التعلم في كل مرحلة. ولأن هناك العديد من الكلمات ذات التردد المنخفض، فمن الأفضل قراءة كتب متدرجة. لأنها تحتوي على مفردات موزعة حسب المستوى اللغوي الخاص بالمتعلم.
وبذلك حتى لا تهدر وقتك على الكلمات ذات التردد المنخفض والتي لا تفيدك في مستواك الحالي من الكفاءة.
حدد بدقه عدد المفردات التي تتقنها
إذا كنت تدرس اللغة الانجليزية منذ عام أو أكثر، فمن الأفضل أن تقيس مدى تقدمك. وتحسب عدد المفردات التي اكتسبتها او تعلمتها. فمعرفة عدد مفرداتك يساعدك على فهم مايتطلب منك فعله لاحقا في تعلم اللغة. كما أنه يساعدك على تحديد نوع الكتب المناسبة لك.
يوضح الجدول 2.2 كيف يمكنك استخدام نتائج اختبار المفردات لاختيار الكتاب المناسب لك.
حجم المفردات | مصدر مادة القراءة |
1000 كلمة أو أقل | اختر كتبًا من المستويات المبكرة للكتب المتدرجة |
1000-2000 كلمة | اختر كتبًا من المستويات المتوسطة للكتب المتدرجة |
2000-4000 كلمة | اختر كتبًا في المستويات العليا للكتب المتدرجة |
4000 كلمة أو أكثر | اختر كتبًا من القصص ذات الكلمات متوسطة التردد |
قوائم الكلمات الرئيسية BNC/COCA
تحتوي قوائم الكلمات الرئيسية BNC/COCA على الكلمات الرئيسية والمكونة من 25000 عائلة كلمات.
- 223.3KB1st 1000 BNC/COCA headwords القائمة الأولى تتكون من الف كلمة
- PDF224.6KB2nd 1000 BNC/COCA headwordsالقائمة الثانية تتكون من الف كلمة
- PDF225.7KB3rd 1000 BNC/COCA headwordsالقائمة الثالثة تتكون من الف كلمة
- PDF225.7KB4th 1000 BNC/COCA headwords القائمة الرابعة تتكون من الف كلمة
- PDF225.8KB5th 1000 BNC/COCA headwords القائمة الخامسة تتكون من الف كلمة
- PDF226.0KB6th 1000 BNC/COCA headwords القائمة السادسة تتكون من الف كلمة
- PDF228.3KB7th 1000 BNC/COCA headwords القائمة السابعة تتكون من الف كلمة
- PDF226.3KB8th 1000 BNC/COCA headwords القائمة الثامنة تتكون من الف كلمة
- PDF226.6KB9th 1000 BNC/COCA headwords القائمة التاسعة تتكون من الف كلمة
- PDF227.0KB10th 1000 BNC/COCA headwords القائمة العاشرة تتكون من الف كلمة
- FILE37.7KBHeadwords of the first 10,000 words القوائم مجتمعة وعددها عشر الاف كلمة
تاريخ موجز للقوائم
بدأ العمل على القوائم بعد فترة وجيزة من تصميم برنامج Vords في أواخر الثمانينيات . حيث قام البرنامج بعد الكلمات المتكررة في النصوص باستخدام عائلات الكلمات. القائمتان اللتان استخدمتا هما قائمة الخدمات العامة للكلمات الإنجليزيةthe General Service List of English Words. وضعها Michael West، وكانت مقسمة إلى قائمتين.
كذلك، كانت هناك قائمة الكلمات الجامعية.
في عام 1998، عمل Averil على تجميع قائمة الكلمات الأكاديمية the Academic Word List. في ذلك الوقت، أعاد Alex Heatley تصميم Vords. أطلق أليكس على البرنامج اسم FVords (Family Vords)، ثم قام بإعادة تسميته إلى Range.
بدأ Averil العمل على تصميم قوائم جديدة لعائلات الكلمات. واستغرق إنشاء كل قائمة لعائلة مكونة من 1000 كلمة أكثر من شهر. وفي عام 2003، أصبح هناك ثلاث قوائم جديدة مكونة من 1000 كلمة. وبحلول عام 2018 أصبح هناك ثمان وعشرون قائمة خاصة بعائلات الكلمات.
الغرض من قوائم الكلمات BNC/COCA
تم تصميم قوائم BNC/COCA في المقام الأول لمتعلمي اللغة الإنجليزية كلغة أجنبية. و صٌممت القوائم بهذه الطريقة لتعكس نمو حجم مفردات المتحدثين الأصليين. بالإضافة إلى اهتمامات الأطفال وفرص التعلم، وخاصة مفردات قصص الأطفال وأفلام الأطفال والتلفزيون.
وهذه القوائم المصممة لمتعلمي اللغة الإنجليزية كلغة أجنبية تحتوي على مفردات كثيرة الاستخدام. مثل تلك التي يحتاجها في السفر إلى الخارج، والدراسة باللغة الإنجليزية، والإنترنت. والتعليم (القراءات المصنفة والكتب الدراسية). ومعظم هذه المفردات تظهر في القوائم الأولى.
محتويات القوائم
تتكون قوائم عائلات الكلمات BNC/COCA من 28 قائمة عائلات كلمات مصنفة حسب تكرار الكلمات. وهناك خمس قوائم إضافية وهي:
- (1) قائمة الأسماء الصحيحة، ويتم الاضافة إليها باستمرار.
- (2) قائمة بالكلمات الهامشية بما في ذلك الكلمات البذيئة وعلامات التعجب والأحرف الأبجدية.
- (3) قائمة transparent compounds.
- (4) قائمة بالاختصارات.
- (5) قائمة بالكلمات الأجنبية.
برامج حاسوبية لاستخدام القوائم
أفضل برنامج لاستخدام القوائم لتحليل المفردات في النصوص هو AntWordProfiler . والذي يتوفر مجانًا من موقع Laurence Anthony.
إعداد القوائم
أول قائمتين من عائلات الكلمات التي تحتوي على الفين كلمة
تم إعداد أول قائمتين من عائلات الكلمات التي تحتوي على 1000 كلمة من المحادثات الإنجليزية بما فيها البريطانية والأمريكية. بالإضافة إلى الأفلام والبرامج التلفزيونية. أما الأقسام المكتوبة فتضمنت قصص وروايات الأطفال الصغار.
القائمة الثالثة من 1000 كلمة، وبقية القوائم
تم إنشاء القوائم الألف المتبقية باستخدام تصنيفات COCA/BNC في البيانات التي قدمها مارك ديفيز (Davies COCA BNC.xls) بعد إزالة أول 2000 عائلة من الكلمات التي قام نيشن بانشائها خصيصًا.
عائلات الكلمات
استندت المعايير المستخدمة في إنشاء عائلات الكلمات إلى المستوى 6 الذي وضعه باور ونيشن (1993). والذي يتضمن جميع البادئات affixes من المستويات 2 إلى 6 (انظر الجدول 2).
الجدول 2: مستويات عائلات الكلمات
المستوى 1 الشكل المختلف هو كلمة مختلفة. يتم تجاهل الأحرف الكبيرة. |
المستوى 2 الكلمات التي يتم تصريفها بانتظام هي جزء من نفس العائلة. فئات التصريف هي – الجمع؛ الشخص الثالث المفرد المضارع؛ الماضي؛ الماضي التام؛ -ing؛ المقارنة؛ صيغة التفضيل؛ الملكية. |
المستوى 3 -able, -er, -ish, -less, -ly, -ness, -th, -y, non-, un-, all with restricted uses. |
المستوى ٤ -al, -ation, -ess, -ful, -ism, -ist, -ity, -ize, -ment, -ous, in-, all with restricted uses. |
المستوى ٥ -age (leakage), -al (arrival), -ally (idiotically), -an (American), -ance (clearance), -ant (consultant), -ary (revolutionary), -atory (confirmatory), -dom (kingdom; officialdom), -eer (black marketeer), -en (wooden), -en (widen), -ence (emergence), -ent (absorbent), -ery (bakery; trickery), -ese (Japanese; officialese), -esque (picturesque), -ette (usherette; roomette), -hood (childhood), -i (Israeli), -ian (phonetician; Johnsonian), -ite (Paisleyite; also chemical meaning), -let (coverlet), -ling (duckling), -ly (leisurely), -most (topmost), -ory (contradictory), -ship (studentship), -ward (homeward), -ways (crossways), -wise (endwise; discussionwise), anti- (anti-inflation), ante- (anteroom), arch- (archbishop), bi- (biplane), circum- (circumnavigate), counter- (counter-attack), en- (encage; enslave), ex- (ex-president), fore- (forename), hyper- (hyperactive), inter- (inter-African, interweave), mid- (mid-week), mis- (misfit), neo- (neo-colonialism), post- (post-date), pro- (pro-British), semi- (semi-automatic), sub- (subclassify; subterranean), un- (untie; unburden). |
المستوى ٦ -able, -ee, -ic, -ify, -ion, -ist, -ition, -ive, -th, -y, pre-, re-. |
مستويات الإطار المرجعي الأوروبي العام للغات CEFR وأجزاء الكلمات وأحجام المفردات
الإطار المرجعي الأوروبي العام للغات (CEFR) عبارة عن سلسلة من ستة مستويات. تُستخدم كمعيار لوصف مستوى كفاءة متعلمي اللغات الأجنبية أو اللغات الثانية. فيما يلي، قام العالم نيشن بربط مستويات الإطار المرجعي الأوروبي العام للغات بأحجام المفردات وأحجام عائلات الكلمات. (أي عدد عائلات الكلمات التي يعرفها المتعلم واللاحقات التي من المحتمل أن تظهر في هذه العائلات).
المستوى | أوصاف الإطار الأوروبي المرجعي العام CEFR | حجم المفردات المقترح | حجم عائلة الكلمات المقترحة |
C2 | متقن بشكل جيد لعدد كبير من المفردات بما في ذلك التعبيرات الاصطلاحية والتعبيرات العامية. | 7000-9000 كلمة | المستوى 6 وما بعده |
C1 | متقن بشكل جيد لمجموعة واسعة من المفردات. بالاضافة إلى للعبارات الاصطلاحية والعبارات العامية. | 5000-6000 كلمة | المستوى 5 |
B2 | لديه مجموعة جيدة من المفردات للأمور المرتبطة بمجاله والموضوعات الأكثر عمومية. يمكنه تنويع الصياغة لتجنب التكرار . | 4000 كلمة (2000-3000 كلمة متكررة بالإضافة إلى 1000-2000 من المفردات التقنية ذات الصلة) | المستوى 4 |
B1 | لديه مفردات كافية للتعبير عن نفسه ببعض العبارات المتداخلة حول معظم المواضيع ذات الصلة بحياته اليومية. مثل الأسرة والهوايات والاهتمامات والعمل والسفر والأحداث الجارية. لديه مفردات كافية لإجراء المعاملات الروتينية اليومية التي تنطوي على مواقف ومواضيع مألوفة. | 2000-3000 كلمة عالية التردد | المستوى 3 |
A2 | لديه مفردات كافية للتعبير عن الاحتياجات التواصلية الأساسية. لديه مفردات كافية للتعامل مع احتياجات البقاء البسيطة. | العائلات الأكثر شيوعًا المكونة من 1000 كلمة | المستوى 3 الجزئي |
A1 | يحتوي على مجموعة أساسية من المفردات | تتكون من 120 كلمة وعبارة من مفردات البقاء* | Flemma + -ly |
يمكنك تصنيف المستوى A على أنه مستوى ابتدائي، والمستوى B على أنه مستوى متوسط، والمستوى C على أنه مستوى متقدم.
والان بامكانك البدء بتعلم اللغة الانجيزية عبر قراءة القائمة الأولى والبحث عن كتاب ممتع يحتوي على هذه المفردات.
المراجع:
تمت الترجمة بواسطة خيمة القراءة من المصادر التالية:
https://www.wgtn.ac.nz/lals/resources/paul-nations-resources/vocabulary-lists
https://www.wgtn.ac.nz/__data/assets/pdf_file/0005/1857641/about-bnc-coca-vocabulary-list.pdf
What do you need to know a foreign language