Проще всего рассматривать это так: тестами ты сам себе ТЗ пишешь.
Я хочу такой-то функционал (написал тест), и пока этого нет (тест провалился).
Если не проверять тесты на предварительную провальность, пришлось бы еще тесты на тесты писать, поскольку есть шанс написать тест, который всегда проходить будет.
По поводу "поведение реализовано": никто не гарантирует, что в процессе последующей разработки или (обновления фреймворка) поведение внезапно не отвалится, так что даже если сейчас оно работает - неплохо бы за этим следить.