المرجح الحركة من المتوسط ، مكتبة برمجية مفتوحة للرؤية الحاسوبية
ولأغراض المقارنة بين الخوارزميات، أرغب في مقارنة نتيجة الكشف عن المصنف المتسلسل المدرب باستخدام إطار فيولا أمب جونز مقابل مصنف سفم هوج الذي قمت بتدريبه. ومع ذلك، فإن إطار فج لا يوجد لديه مشكلة مع نسبة غير متكافئة للإيجابيات والسلبيات، على سبيل المثال 500 الايجابيات و 100 السلبيات (لا تقول لي هذا خطأ من فضلك، والدكتوراه كله هو حول إثبات أن الوعي السياق يمكن أن تقلل من الأرقام السلبية على نحو فعال. إذا وأود أن تحويل هذا إلى تصنيف سفم ومع ذلك، وأنا أقرأ في العديد من المدونات التي تستخدم كفسفم ينبغي أن يتم مع عدد متساو من عينات التدريب الإيجابية والسلبية، وإذا لم يكن لا بد لي من إضافة التحيز، ولكن لا أستطيع أن أجد مثالا أن يفعل ذلك بالضبط. هل يمكن لأي شخص أن يقدم لي بعض التوجيهات حول كيفية تطبيق هذا هل هذا ممكن حتى داخل إطار أوبينكف تحرير 1: لقد لاحظت الناس تشير إلى استخدام ليبسفم أو سفمليت لتدريب النموذج. ومع ذلك، أود أن التمسك أوبينكف فقط، والتي ينبغي أن تكون في الواقع ممكن، وأنا أعلم من عمل دولر الذي هو واحد من الموارد ورقة الرئيسية أنا تستخدم لبلدي البحوث :) لقد أنشأت بنجاح المجمع حول إخراج كفس التدريب فم لخلق الانتاج التي يمكن استخدامها من قبل واجهة هودسكريبتور. فرع ماستر حتى حصلت على نسخة مدمجة مؤخرا لتلك التي قام بها ماثيو بورتشانون. ومع ذلك، كما أن العديد من وظائف مل في أوبينكف، ضبط المعلمة والدراسة غير مرهقة :) وسوف أرى إلى أي مدى أحصل على، لا تتردد في الاتصال بي من وقت لآخر لسؤال عن التقدم فيما يتعلق الأوزان، فعلت بعض الاختبارات الصغيرة للتحقق من تأثير. وفيما يلي نتائجي: مع الأوزان 0.9، 0.1 (0.9 لأكبر فئة، 0.1 لأصغر فئة): يمكنك أن ترى تغيير الأوزان بوضوح في هذه الصور. آمل أن يزيل ذلك الأمور قليلا. على ملاحظة جانبية: حاولت القيام بذلك في بيثون ولكن لا يبدو أن متغير كلاسويتس تعيين بشكل صحيح (انظر هذا السؤال لمزيد من المعلومات). للتحايل على هذا كنت قد شفرت الأوزان في مصدر أوبينكف، وذلك باستخدام c سيكون على الأرجح نظرا للنتائج الصحيحة كذلك، كما يبدو أن الأوزان للحصول على تعيين بشكل صحيح ل ج. كود المستخدمة لتوليد المثال: cjlinpaperslibsvm. pdf بشكل صحيح، وهذا يجب أن تعمل مع كلاسويتس - parameter، الذي يشكل عقوبة، أي تعيين وزن أعلى للفئة وجود المزيد من العينات. مثال: 400 بوس، 100 نيغ --gt كلاسويت للطبقة الإيجابية 45 0.8 و 0.2 للصنف السلبي. لاحظ أنه بالنسبة للمصنفين الآخرين يمكن تحقيق ذلك في كثير من الأحيان من خلال إعطاء فئة قبل. نلاحظ أيضا أنه إذا كان لديك اختبار غير متوازن (وليس التدريب) تعيين ثم ينبغي استخدام قياس الخطأ المناسب (على سبيل المثال غير المرجح المتوسط الدقة، فينشيارلي وآخرون تحدي سمة المتحدث إنتيرزبيش 2012). راجع للشغل. بقدر ما أعرف أوبينكفس سفم يقوم على ليبسفم. حسنا أنا مقتنع أنه يستند في الواقع إلى ليبسفم منذ ذكر في تقديم الأصل من التعليمات البرمجية إلى مستودع أوبينكف. سأحاول اقتراحكم باستخدام المعلمة كلاسويتس ومعرفة ما إذا كان هذا فعلا لا خدعة شكرا جزيلا لكم على الاقتراح سوف تبقى لكم نشر عن التقدم يتيح التفاف بعض الاشياء حتى، أي ملاحظات أكثر من موضع ترحيب. حاولت تطبيق عامل الوزن لكل عنصر، ولكن هذا لم يبدو للعمل، وإعطاء رفع إلى خطأ في تنفيذ أوبينكف: ومع ذلك يعني أنه لا يتبع النهج الافتراضي من ليبسفم. ومع ذلك، من خلال تحديد وزن متساو أو أوزان مختلفة لكل فئة، يبدو أن ناقلات دعم بلدي لا تتغير في ملف شمل الخاص بي، وهو غريب تماما كما أراه. أو لا أحد يعرف لماذا يجب أن تكون ناقلات الدعم متطابقة وهذا هو السلوك يعني أن يكون تحميلها ديملر شخص كاشف البيانات. لديها حوالي 15.000 الصور الإيجابية (سابقة إلى 48x96 القرار) و 7000 الصور السلبية (صور خلفية بالحجم الكامل). إذا اتخذت الخطوات التالية: أخذ 15000 النوافذ الإيجابية وخلق واصف هوج منه. المعلمات هي ويندوزيزي 48x96 سيلزيزي 8x8 بلوكسيزي 16x16 و ويندوستريد 8x8، والتي هي المعلمات الرسمية المستخدمة. أخذ السلبيات 7000 وقطع 15000 النوافذ 48x96 عشوائية من تلك. وضعها أيضا من خلال عملية إنشاء واصف. أضفت المجموعتين إلى مصفوفة ناقلات التدريب وأوجدت التسميات المناظرة. تنفيذ التدريب سفم باستخدام المعلمات التالية تستخدم وظيفة التحويل، داخل ورابركلاس لتوليد متجه واحد لوصف هوج باستخدام التعليمات البرمجية التالية ثم تحميلها في مجموعة من الصور اختبار وتنفيذ كاشف متعدد اللغات على ذلك الذي تم دمجه في هودسكريبتور وظيفة. ومع ذلك، فإن النتيجة هي أبعد من أن تكون مرضية. كما ترون أدناه لذلك هذا يثير بعض الأسئلة: هل هو بخير لمجرد عينة الصور السلبية عشوائيا أو يجب أولا التأكد من أن المشاة في الصورة الأصلية هي عن حجم النموذج، بحيث العينات السلبية هي أكثر تمثيلا ماثيو بارناشون. كما قمت بتقديم واجهة سورتليك، هل ربما ترى أي شيء أفعله خطأ هذه المشكلة قد أعطاني صداع لأكثر من أسبوع الآن. أيضا، التدريب مع أوزان متساوية لكل فئة أو التدريب مع عدم المساواة (0.8 مقابل 0.2) الأوزان لكل فئة لا يغير القيم المتجه الناتج في نموذج شمل. هل هذا طبيعي حتى أتوقع. (المزيد) مرحبا، هذا سيكون مقالا بسيطا جدا، ولكنك ستجده مفيدا جدا. بل هو حول استخراج الخلفية من الفيديو. لنفترض أنك تعطى الفيديو من لقطات من حركة المرور، قد يكون بعض الشيء من هذا القبيل. حركة المرور في الهند. ويطلب منك العثور على خلفية تقريبية. أو أي شيء من هذا القبيل. استخراج الخلفية تأتي مهمة في تتبع الكائن. إذا كان لديك بالفعل صورة للخلفية العارية، ثم أنها بسيطة. ولكن في كثير من الحالات، لن يكون لديك مثل هذه الصورة وهكذا، سيكون لديك لإنشاء واحد. هذا هو المكان الذي يأتي معدل التشغيل في متناول اليدين. (فكرت في هذا عندما سأل رجل واحد سؤال في سوف الارتباط) وظيفة نستخدم هنا للعثور على متوسط الجري هو cv2.accumulateWeighted (). على سبيل المثال، إذا كنا نشاهد فيديو، فإننا نواصل تغذية كل إطار لهذه الوظيفة، وتحافظ الدالة على إيجاد متوسطات جميع الإطارات التي تغذيها وفقا للعلاقة أدناه: سرك ليس سوى صورة المصدر. ويمكن أن يكون الرمادي أو صورة ملونة وإما 8 بت أو 32 بت نقطة عائمة. دست هي صورة الإخراج أو المتراكم مع نفس القنوات مثل صورة المصدر، وهي إما النقطة العائمة 32 بت أو 64 بت. أيضا، يجب أن نعلن ذلك أولا إلى القيمة التي سيتم اتخاذها كقيمة أولية. ألفا هو وزن الصورة المدخلة. وفقا ل دوس، ألفا ينظم سرعة التحديث (مدى سرعة تراكم 8220forgets8221 حول الصور السابقة). وبعبارة بسيطة، إذا كان ألفا قيمة أعلى، يحاول متوسط الصورة التقاط تغييرات سريعة جدا وقصيرة في البيانات. إذا كانت قيمة أقل، يصبح المتوسط بطيئا ولن ينظر في التغييرات السريعة في الصور المدخلات. وسوف أشرح ذلك قليلا مع مساعدة من الصور في نهاية المقال. في رمز أعلاه، لقد حددت متوسطين، واحد مع قيمة ألفا أعلى وآخر مع قيمة ألفا أقل حتى تتمكن من فهم تأثير ألفا. في البداية يتم تعيين كل من الإطار الأولي لالتقاط. وفي حلقة تحصل على تحديث. يمكنك مشاهدة بعض النتائج في رابط سوف الذي قدمته من قبل. (I تقديم هذه النتائج هنا، يمكنك التحقق من رمز وقيمة ألفا هناك): لقد استخدمت كاميرا الويب الخاص بي وحفظ الإطار الأصلي وتشغيل المتوسط في لحظة معينة. هذا هو إطار من الفيديو حركة المرور نموذجية التي اتخذتها كاميرا ثابتة. كما ترون، سيارة تسير على الطريق، والشخص يحاول عبور الطريق في لحظة معينة من الزمن. ولكن انظر متوسط التشغيل في ذلك الوقت. لا يوجد أي شخص وسيارة في هذه الصورة (في الواقع هو هناك، إلقاء نظرة فاحصة، ثم سوف نرى ذلك، والشخص هو أكثر وضوحا من السيارة، لأن السيارة تتحرك بسرعة جدا وعبر الصورة، فإنه ليس كثيرا تأثير على المتوسط، ولكن الشخص هناك لفترة طويلة، لأنه بطيء ويتحرك عبر الطريق). الآن نحن بحاجة إلى رؤية تأثير ألفا على هذه الصور. تمهيد الصور التفسير أدناه ينتمي إلى كتاب رؤية الكمبيوتر: خوارزميات وتطبيقات ريتشارد سيليسكي و ليارنينغوبينكف تجانس. وتسمى أيضا التشويش. هو عملية معالجة الصور بسيطة ومتكررة. هناك العديد من الأسباب لتمهيد. في هذا البرنامج التعليمي سوف نركز على تجانس من أجل الحد من الضوضاء (سترى الاستخدامات الأخرى في الدروس التالية). لإجراء عملية تمهيد سوف نقوم بتطبيق فلتر على صورتنا. النوع الأكثر شيوعا من المرشحات خطية. حيث يتم تحديد قيمة pixel8217s الناتج (أي) كمجموع مرجح لقيم بكسل الإدخال (بمعنى:) يساعد على تصور عامل تصفية كنافذة من المعاملات التي تنزلق عبر الصورة. وهناك العديد من أنواع المرشحات، وهنا سوف نذكر الأكثر استخداما: تصفية مربع عادي هذا المرشح هو أبسط من كل كل بكسل الانتاج هو متوسط جيرانها النواة (كل منهم يساهم بأوزان متساوية) نواة أدناه: غاوسيان مرشح ربما المرشح الأكثر فائدة (وإن لم يكن أسرع). يتم تصفية غاوس عن طريق تحويل كل نقطة في صفيف الإدخال مع نواة غاوس ثم تلخيص كل منهم لإنتاج مجموعة المخرجات. فقط لجعل الصورة أكثر وضوحا، وتذكر كيف نواة 1D غاوس تبدو وكأنها على افتراض أن الصورة هي 1D، يمكنك ملاحظة أن بكسل يقع في الوسط سيكون أكبر وزن. ينخفض وزن جيرانها مع زيادة المسافة المكانية بينها وبين بكسل المركز. تذكر أنه يمكن تمثيل غاوس ثنائي الأبعاد على النحو التالي: ميديان فيلتر يعمل المرشح الوسيط على كل عنصر من عناصر الإشارة (في هذه الحالة الصورة) ويستبدل كل بكسل بمتوسط وحدات البكسل المجاورة (الموجود في حي مربع حول البكسل المقيسة ). تصفية الثنائية حتى الآن، شرحنا بعض المرشحات التي الهدف الرئيسي هو تسهيل صورة المدخلات. ومع ذلك، في بعض الأحيان المرشحات لا تذوب فقط الضوضاء، ولكن أيضا على نحو سلس بعيدا حواف. لتجنب هذا (على الأقل إلى حد ما)، يمكننا استخدام مرشح ثنائي. وبطريقة مماثلة للمرشاح الغوسي، يراعي المرشح الثنائي وحدات البكسل المجاورة مع الأوزان المخصصة لكل منها. هذه الأوزان لها عنصرين، الأول منها هو نفس الترجيح المستخدم من قبل مرشح غاوس. ويأخذ العنصر الثاني في الاعتبار الفرق في الكثافة بين البكسل المجاور والبكسل المقيَّم. للحصول على شرح أكثر تفصيلا يمكنك التحقق من هذا الرابط ماذا يفعل هذا البرنامج بتحميل الأحمال تطبيق 4 أنواع مختلفة من المرشحات (شرح في نظرية) وتظهر الصور التي تمت تصفيتها بالتتابع شرح Let8217s تحقق من وظائف أوبينكف التي تنطوي فقط على إجراء تمهيد، منذ بقية هو معروف بالفعل من الآن. مرشح كتلة عادي: أوبينكف يوفر طمس وظيفة لأداء تمهيد مع هذا الفلتر. نحدد 4 وسيطات (مزيد من التفاصيل، راجع المرجع): سرك. مصدر الصورة دست. صورة الوجهة حجم (w، h). يحدد حجم النواة ليتم استخدامها (عرض w بكسل و ارتفاع h بكسل) نقطة (-1، -1). يشير إلى مكان وجود نقطة الارتكاز (البكسل الذي تم تقييمه) فيما يتعلق بالحي. إذا كان هناك قيمة سلبية، ثم يعتبر مركز النواة نقطة ارتساء. يتم تنفيذها من قبل وظيفة غوسيانبلور: هنا نستخدم 4 وسيطات (مزيد من التفاصيل، والتحقق من مرجع أوبينكف):
Comments
Post a Comment