В цілому, AI-чатботи не повинні вживати образливі слова або надавати інструкції зі створення контрольованих речовин. Однак, здається, що деякі моделі мовлення можуть бути переконані порушити власні правила за допомогою відповідних психологічних стратегій….
Категорія: Новини
Apple планує представити нові iPhone та інші пристрої 9 вересня
Apple анонсувала проведення свого наступного заходу з презентацією продуктів у вівторок, 9 вересня, о 10 ранку за тихоокеанським часом (1 по обіді за східним). Хоча зазвичай анонси компанії не вказують на деталі…
Meta намагається впоратися зі своїми чат-ботами на основі штучного інтелекту
Meta змінює правила роботи своїх чат-ботів після розслідування, яке виявило, що ці технології можуть небезпечно взаємодіяти з неповнолітніми. Компанія повідомила, що чинні чат-боти тепер навчаються уникати тем, пов’язаних із самогубством, шкодою для…
ChatGPT сприяв підлітку у плануванні самогубства
У процесі спілкування ChatGPT згадував про самогубство 1,275 разів — у шість разів частіше, ніж сам Адам, зазначено у позові. Зрештою, система OpenAI позначила 377 повідомлень за змістом про самопошкодження, з яких…
Ні, оновлення Windows, швидше за все, не вбило ваш SSD
Останнім часом з’являлися повідомлення про те, що останні оновлення Windows 11 (зокрема KB5063878 та KB5062660) викликають проблеми з деякими SSD, що використовують контролери Phison. Технічні блогери в YouTube та TikTok швидко відреагували…
Doge підозрюють у копіюванні повної бази даних соціального забезпечення на ненадійний хмарний сервер
Комісар Френк Бізіньяно та Адміністрація соціального забезпечення США (SSA) серйозно ставляться до всіх скарг від інформаторів, зазначили в агентстві. Усі персональні дані зберігаються в безпечних середовищах, які мають надійні засоби захисту для…
Електроенергія США 2025
Яка ситуація з енергетичними джерелами? Попри незначне зниження, природний газ залишається лідером, забезпечуючи 39 відсотків енергії, яка потрапила в електромережу в першій половині 2025 року. Ядерна енергетика займає друге місце з 18…
Після підліткового самогубства OpenAI заявляє про свою роль у підтримці людей у найскладніший час
Адам Рейн навчився обходити засоби безпеки, стверджуючи, що пише історію — техніка, яку, за словами позову, сам ChatGPT і запропонував. Ця уразливість частково виникає через послаблені системи захисту щодо фантазійних рольових ігрових…
Користувачі Steam у Великобританії повинні будуть мати кредитну картку для доступу до ігор з “дорослим контентом
Valve почала дотримуватися Закону про онлайн-безпеку Великобританії, впровадивши вимогу для всіх користувачів із цієї країни підтверджувати свій вік за допомогою кредитної картки, щоб отримати доступ до сторінок і гри з “дорослим контентом”…
Автори святкують історичне рішення, яке незабаром надійде у справі класового позову проти Anthropic
Автори святкують досягнення “історичної” угоди, яка, як очікується, буде підписана найближчим часом у рамках колективного позову щодо даних для навчання AI Anthropic. У вівторок суддя окружного суду США Вільям Олсап підтвердив, що…