VGA - это 640x480? Если так, то могу предположить, что видео уходит с камеры совсем не сжатым. В самом крутом случае объем передаваемых данных составит "всего" 12Мб/с, что легко пролазит через любое USB 2.0 от любого производителя. Таким образом, единственным источником проблем в цепочке может быть DirectShow драйвер

В принципе DirectShow известна своими достаточно жесткими ограничениями. В одном из сценариев драйвер умышленно накапливает некий объем видеоданных и лишь потом отдает его в систему в целях стабилизации фрейм-рейта и синхронизации со звуковыми источниками. Похоже в вашем случае объем этого буфера составляет около секунды.
Хорошо, а давайте подойдем к вопросу с другой стороны. Чем мешает задержка в секунду для целей использования совместно со Skype? Или есть слишком заметная рассинхронизация между речью и изображением?